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采 言 


PostgreSQL 宣称 自己 是 世界 上 最 先进 的 开源 数据 库 。 我 们 非常 赞同 这 种 


说 法 o 


我 们 希望 本 书 能 帮助 读者 在 PostgreSQL 的 核心 概念 与 功能 特性 等 方面 
打下 坚实 的 基础 ， 正 是 这 些 先 进 的 概念 与 功能 特性 使 得 这 球 数 据 库 如 此 
杰出 和 与 众 不 同 。 同 时 我 们 将 使 读者 相信 ，PostgreSQL“ 最 先进 的 开源 
数据 库 ” 这 一 称号 是 实 至 名 归 的 。 这 球 数 据 库 体系 庞大 、 功 能 先进 ， 
此 如 果 一 本 书 试图 将 其 强大 特性 介绍 清楚 ， 其 篇 幅 一 定 不 会 少 于 3500 
页 。 事 实 上 ， 大 多 数 用 户 并 不 需要 摸 透 它 所 有 复杂 深奥 的 高 级 功能 ， 
此 在 这 本 不 到 300 页 的 书 中 ， 我 们 希望 能 够 帮助 读者 提纲 者 领 抓 住 要 
点 ， 从 而 做 到 像 本 书 书 名 所 宣称 的 那样 即 学 即 用 。 


本 书 在 介绍 每 个 功能 点 的 同时 都 会 附带 其 适用 的 上 下 文 场景 ， 这 样 读者 
就 可 以 了 解 每 个 功能 点 的 适用 范围 以 及 功能 表现 。 我 们 假设 读者 已 经 具 
备 了 其 他 数据 库 的 使 用 经 验 ， 这 样 我 们 就 可 以 直 奔 主题 ， 介 绍 
PostgreSQL 的 关键 功能 点 ， 而 不 必 在 预先 普及 数据 库 基础 知识 上 浪费 时 
间 。 我 们 在 一 些 必 要 的 地 方 附 上 了 相关 资源 ， 以 便于 读者 深入 钻研 感 兴 
趣 的 功能 点 。 这 些 资源 的 内 容 多 种 多 样 ， 比 如 官方 手册 的 特定 章节 、 网 
上 有 帮助 的 文章 以 及 PostgreSQL 大 牛 们 的 博客 文章 等 ， 当 然 也 包括 我 
们 自己 的 官网 Postgre Online Journal 上 的 一 些 文章 ， 这 个 网 站 上 有 我 们 
自己 编写 的 很 多 PostgreSQL 相关 文章 ， 也 有 一 些 研究 PostgreSQL 与 其 
他 应 用 之 间 互 操作 性 的 文章 。 


本 书 主要 介绍 PostgreSQL 9.5、PostgreSQL 9.6 以 及 PostgreSQL 10， 但 
也 会 涉及 之 前 版 本 中 一 些 独 特 的 高 级 特性 。 














本 书 读者 


对 于 从 其 他 数据 库 引 擎 迁移 到 PostgreSQL 的 读者 来 说 ， 我 们 将 在 本 书 
中 列 出 其 他 数据 库 的 高 级 特性 在 PostgreSQL 中 的 实现 方法 。 更 重要 的 
是 ， 我 们 会 重点 介绍 一 些 在 PostgreSQL 中 可 以 实现 而 在 其 他 数据 库 中 
很 难 或 者 不 可 能 实现 的 高 级 功能 。 


本 书 不 会 教 读者 怎么 写 SQL， 相 关 学 习 资料 有 很 多 ， 因 此 这 不 是 本 书 的 
重点 。 学 习 SQL 就 像 学 习 下 模 几 个 小 时 束 能 了 解 基本 规则 ， 但 要 
熟练 掌握 却 需 要 终身 持续 学 习 。 你 会 发 现 选 择 PostgreSQL 是 一 个 明智 
的 决定 ， 并 将 因此 而 受益 终 丑 。 


如 果 你 是 对 PostgreSQL 非常 熟悉 的 老 用 户 或 者 是 经 验 丰 富 的 DBA， 那 
么 本 书 中 的 大 量 内 容 你 都 会 觉得 很 熟悉 ， 但 即便 如 此 ， 你 也 一 定 可 以 学 
到 新 版 PostgreSQL 中 引入 的 一 些 新 特性 ， 也 很 可 能 会 了 解 到 一 些 在 老 
版 本 中 已 经 提供 但 此 前 被 你 遗漏 的 功能 点 。 好 吧 ， 如 果 你 对 于 书 中 内 容 
均 已 了 解 ， 那 么 本 书 对 你 来 说 依然 有 价值 ， 因 为 它 比 官方 的 PostgreSQL 
手册 要 轻 得 多 ， 最 起 码 是 便于 携带 了 。 


如 果 你 还 没 接触 过 PostgreSQL， 那 么 本 书 将 扮演 你 身边 的 
PostgreSQL“ 布 道 师 ” 的 角色 。 这 位 “布道 师 ” 将 疝 你 证 明 : 多 用 那些 很 弱 
的 数据 库 一 天 ， 你 的 系统 就 不 得 不 多 做 一 天 功能 上 的 受 协 ;多 绑 在 商业 
数据 库 上 一 天 ， 你 就 会 被 那 些 广 商 掏 走 更 多 的 钱 。 


最 后 ， 如 宋 你 的 工作 与 数据 库 领 域 甚至 是 IT 界 坚 无 关系 ， 又 或 者 你 刚 
刚 幼儿 园 毕 业 ， 那 么 能 人 否 购买 本 书 呢 ? 答案 依然 是 “可 以 ”! 因为 封面 上 
可 爱 的 象 胸 鼠 图 片 就 已 经 让 本 书 物 有 所 值 了 。 
































大 于 PostgreSQL 的 更 多 信息 


PostgreSQL 有 一 套 制 作 精 民 的 在 线 文档 ， 建 议 读 者 收藏 它 。 这 套 文 要 有 
HTML 和 PDF 两 种 格式 ， 还 有 纸 质 印刷 版 。 


其 他 可 用 的 PostgreSQL 资源 如 下 。 


。 Planet PostgreSQL 是 PostgreSQL 技术 博客 文章 的 汇聚 站 点 ， 其 中 
包含 从 PostgreSQL 核心 开发 人 员 到 普通 用 户 编写 的 各 类 文章 ， 包 
括 新 特性 用 法 介绍 、 原 有 特性 的 巧妙 用 法 以 及 已 发 现 但 尚未 正式 修 
复 的 bug 报告 。 

。 PostgreSQL Wiki 提供 对 PostgreSQL 各 个 方面 的 使 用 技巧 说 明 ， 以 
及 从 其 他 数据 库 移 植 到 PostgreSQL 的 方法 。 

e。 PostgreSQL Books 提供 有 关 PostgreSQL 的 图 书 列表 信息 。 

。 PostGIS in Action Books 是 我 们 已 出 版 的 关于 PostGIS 和 pgRouting 
插件 的 图 书 的 官方 站 点 。PostGIS 是 PostgreSQL 上 的 空间 数据 管理 
插件 ，pgRouting 是 基于 PostGIS 的 一 款 网 络 路 径 规划 插件 ， 在 导 
航 出 行 类 应 用 中 经 常 要 用 到 。 








代码 与 输出 格式 


对 于 括号 中 的 内 容 ， 我 们 一 般 会 将 左 括号 与 之 前 的 内 容 放 置 于 同一 行 ， 
右 括号 单独 放置 一 行 。 这 是 经 典 的 C 语言 排版 风格 ， 我 们 比较 喜欢 ， 因 
为 它 可 以 减少 空 行 数 。 格 式 如 下 


function ( 
Welcome to PostgreSQL 


); 





为 节省 版 面 ， 我 们 还 移 除了 命令 行 执 行 输出 结果 中 无 意义 的 空格 ， 因 此 
人 请 不 要 担心 ， 这 是 
正常 的 。 


当 一 行 中 存在 多 个 喜 号 时 ， 如 果 每 个 元 聚 的 长 度 都 比较 短 ， 我 们 会 把 运 
号 之 后 的 空格 去 掉 。 比 如 : (a, b,'c)。 


PostgreSQL 的 SQL 解释 器 会 将 语句 中 的 制 表 符 、 换 行 待 和 回 车 符 当 作 
空白 处 理 。 在 我 们 提供 的 示例 代码 中 ， 一 般 会 使 用 空白 而 不 是 制 表 符 作 
为 综 进 符 。 请 确保 使 用 的 代码 编辑 器 不 会 目 动 将 制 表 符 、 换 行 符 和 回 车 
符 删 除 ， 或 者 把 它们 转换 为 空格 以 外 的 字符 ， 人 否则 会 导致 问题 。 


如 果 在 执行 示例 代码 时 遇 到 了 问题 ， 请 检查 你 复制 过 来 的 代码 与 我 们 提 
供 的 原始 代码 是 人 否 一 致 。 


注意 ， 有 些 示 例 适 用 于 Linux， 而 有 些 适 用 于 Windows。 传 统 上 ， 二 者 
的 路 径 分 隔 符 是 不 同 的 ，Linux 下 是 斜 枉 〈/ ) ， 而 Windows 下 是 有 反 和 斜 
杠 〈\ ) 。 但 请 注意 : 在 PostgreSQL 中 ， 即 使 是 Windows 环境 下 ， 也 
一 定 要 使 用 Linux 的 / 作为 路 径 分 隔 符 ， 而 不 是 Windows 传统 的 \ 。 
你 会 看 到 示例 代码 中 有 类 似 于 /postgresql_book/somefile.csv 这 
样 的 路 径 ， 这 指 的 是 Linux 服务 器 根 目 录 下 的 路 径 。 如 果 使 用 的 是 
Windows 环境 ， 那 么 需要 加 上 驱动 右 符 ， 因 此 路 径 要 改 

为 : C:/postgresql_book/somefile.csv 。 











排版 约定 
本 书 将 使 用 如 下 排版 约定 。 
。 黑体 
表示 新 术语 。 
等 宽 字体 (constant width ) 


表示 程序 片段 ， 以 及 正文 中 出 现 的 变量 、 函 数 名 、 数 据 库 、 数 据 类 
型 、 环 境 变量 、 语 句 和 关键 字 等 。 


加 粗 等 宽 粗 体 ( constant width bold) 
表示 应 该 由 用 户 输 入 的 命令 或 其 他 文本 。 
斜体 等 宽 斜体 ( constant width italic) 


表示 应 玲 换 成 用 户 提 供 的 值 或 由 上 下 文 决定 的 值 。 





® 该 图 标 表示 提示 或 建议 。 











做 、 该 图 标 表示 警告 或 警示 。 


使 用 代码 示例 


代码 和 数据 示例 可 以 从 
http://www.postgresonline.com/downloads/postgresql_book_3e.zip 下 载 。 


本 书 是 要 攻 你 完成 工作 的 。 一 般 来 说 ， 如 果 本 书 提供 了 示例 代码 ， 你 可 
以 把 它 用 在 你 的 程序 或 文档 中 。 除 非 你 使 用 了 很 大 一 部 分 代码 ， 否 则 无 
须 联系 我 们 获得 许可 。 比 如 ， 用 本 书 的 几 个 代码 片段 写 一 个 程序 就 无 须 
获得 许可 ， 销 售 或 分 发 O'Reilly 图 书 的 示例 光盘 则 需要 获得 许可 ， 引用 
本 书 中 的 示例 代码 回答 问题 无 须 获得 许可 ， 将 书 中 大 量 的 代码 放 到 你 的 
产品 文档 中 则 需要 获得 许可 。 


我 们 很 希望 但 并 不 强制 要 求 你 在 引用 本 书 内 容 时 加 上 引用 说 明 。 引 用 说 
明 一 般 包括 书 名 、 作 者 、 出 版 社 和 ISBN。 比 如 : “PostgreSQL : Up and 
Running , Third Edition by Regina Obe and Leo Hsu (O'Reilly). Copyright 
2018 Regina Obe and Leo Hsu, 978-1-491-96341-8.” 


如 果 你 觉得 自己 对 示例 代码 的 用 法 超出 了 上 述 许可 的 范围 ， 欢 迎 你 通过 
permissions(@ oreilly.com 与 我 们 联系 。 




















O'Reilly Safari 


SY Safari 


Safari (原来 叫 Safari Books Online〉 是 一 个 会 员 制 的 培训 和 参考 平台 
面 同 企业 、 政 府 、 教 育 机 构 和 个 人 。 


会 员 可 以 访问 几 和 二 种 图 书 、 培 训 视 频 、 学 习 路 径 、 互 动 式 教程 和 精 选 播 
放 列 表 ， 提 供 这 些 资 源 的 出 版 商 超 过 250 家 ， 包 括 O'Reilly Media、 
Harvard Business Review、 Prentice Hall Professional、Addison-Wesley 
Professional、 Microsoft Press、Sams、Que、Peachpit Press、Adobe、 
Focal Press、 Cisco Press、John Wiley & Sons、 Syngress、Morgan 
Kaufmann、 IBM Redbooks、Packt、Adobe Press、FT Press、Apress、 
Manning、 New Riders、McGraw-Hill、Jones & Bartlett、Course 
Technology， 等 等 。 








要 获得 更 多 信息 ， 请 访问 http://oreilly.com/safari 。 


联系 我 们 
请 把 对 本 书 的 评价 和 问题 发 给 出 版 社 。 美 国 : 
O'Reilly Media, Inc. 
1005 Gravenstein Highway North 
Sebastopol, CA 95472 
中 国 : 
北京 市 西城 区 西直门 南大 街 2 号 成 馈 大 厦 C 座 807 室 (100035) 
奥 莱 利 技术 咨询 〈 北 京 ) 有 限 公 司 
对 于 本 书 的 评论 和 技术 性 问题 ， 请 发 送 电子 邮件 


到 : bookquestions@oreilly.com 
要 提交 勘误 ， 请 访问 本 书 的 勘误 页 面 
(https://www.oreilly.com/catalog/errata.csp?isbn=0636920052715 ) 。1! 











1 本 书 中 文 版 勘误 请 到 http://www .ituring.com.cn/book/2460 查看 和 提交 。 编者 注 




















本 书 的 配套 网 站 地 址 是 : https://www.oreilly.com/catalog/errata.csp? 
isbn=0636920052715 


要 联系 本 书 作 者 ， 请 发 送 邮 件 到 Ir@pcorp.us 。 
对 于 本 书 的 评论 和 技术 性 问题 ， 请 发 送 电子 邮件 


到 : bookquestions@oreilly.com 


要 了 解 更 多 有 关 O'Reilly 图 书 、 培 训 课 程 、 会 议和 新 闻 的 信息 ， 请 访问 
以 下 网 站 : http:/www.oreilly.com 


我 们 在 Facebook 的 地 址 如 下 : http:/facebook.comy/oreilly 


请 关注 我 们 的 Twitter 动态 : http://twitter.com/oreillymedia 


我 们 的 YouTube 视频 地 址 如 下 : http://www.youtube.com/oreillymedia 


电子 书 
扫描 如 下 二 维 码 ， 即 可 购买 本 书 电子 版 。 





第 1 章 基础 知识 


PostgreSQL 是 一 款 极 其 强大 的 数据 库 ， 它 的 很 多 特性 可 能 是 你 前 所 未 见 
的 。 它 的 部 分 特性 在 其 他 知名 数据 库 中 也 有 ， 但 名 称 可 能 不 同 。 在 深入 
钻研 官方 手册 之 前 ， 你 需要 了 解 一 些 核心 概念 ， 本 章 将 为 你 介绍 这 些 概 
念 ， 期 间 也 会 涉及 其 他 数据 库 中 的 相关 概念 和 术语 。 


本 章 将 首先 介绍 如 何 下 载 和 安装 PostgreSQL， 然 后 会 介绍 一 些 必 备 的 管 
理工 具 和 PostgreSQL 术语 。 本 书写 作 之 时 ，PostgreSQL 10 已 发 布 ， 我 
们 将 重点 介绍 该 版 本 的 一 些 新 特性 。 本 章 末尾 会 提供 一 些 帮助 资源 ， 当 
你 需要 额外 的 帮助 或 者 报告 bug 时 会 用 得 到 。 





1.1 为 什么 应 该 选择 PostgreSQL 


PostgreSQL 是 一 款 企 业 级 关系 型 数据 库 管 理 系统 ， 即 使 与 Oracle、 
Microsoft SQL Server、IBM DB2 等 业界 最 好 的 商用 数据 库 相 比 也 坚 不 
逊色 。PostgreSQL 之 所 以 如 此 特别 ， 是 因为 它 不 仅仅 是 一 个 数据 库 ， 还 
是 一 个 功能 强大 的 应 用 开发 平台 。 


PostgreSQL 的 速度 很 快 。 大 量 的 评测 数据 已 经 表明 : 与 其 商用 以 及 开源 
竞争 对 手相 比 ，PostgreSQL 的 速度 要 么 远 远 胜出 ， 要 么 旗 鼓 相当 。 


PostgreSQL 文 持 用 多 种 编程 语言 编写 存储 过 程 和 函数 。 除 了 系统 目 带 的 
C、SQL 和 PL/ pgSQL 编程 语言 外 ， 还 可 以 通过 安装 扩展 包 来 文 持 
PL/Perl、PL/Python、PL/V8 〈 又 称 为 PL/JavaScript) 、PL/Ruby 以 及 
PL/R 等 。 这 种 文 持 多 语言 的 能 力 可 以 让 开发 人 员 根 据 待 解决 问题 的 特 
点 来 选择 最 合适 的 语言 。 比 如 可 以 使 用 R 语言 来 解决 统计 和 图 形 领域 的 
问题 ， 通 过 Python 来 调用 Web 服务 ， 通 过 使 用 SciPy 库 来 进行 科学 计 
算 ， 通 过 PL/V8 来 进行 数据 验证 、 字 符 串 处 理 和 JSON 数据 处 理 ， 等 
等 。PostgreSQL 不 但 文 持 种 类 繁多 的 开发 语言 ， 使 用 过 程 也 很 简单 : 先 
找到 你 需要 的 函数 ， 看 下 它 是 用 什么 语言 编写 的 ， 在 PostgreSQL 中 安 
言 的 扩展 包 ， 然 后 把 代码 复制 过 来 就 可 以 执行 了 。 真 的 不 


大 多 数 数 据 库 会 限制 用 户 只 能 使 用 预定 义 的 数据 类 型 ， 比 如 整 型 、 字 符 
串 、 文 本 型 、 布 尔 型 等 。PostgreSQL 在 数据 类 型 的 文 持 方面 有 两 个 优 
势 : 不 但 支持 比 绝 大 多 数 数据 库 更 丰富 的 原生 数据 类 型 ， 而 且 还 允许 用 
户 按 需 自 定义 数据 类 型 。 如 果 用 户 需 要 更 复杂 的 数字 类 型 ， 那 么 可 以 定 
义 包含 两 个 浮 点 类 型 (float) 的 复合 类 型 ， 如果 需 要 定义 一 个 三 角形 ， 
那么 可 以 先 定义 一 种 “坐标 ”类 型 ， 然 后 再 定义 一 种 包含 三 个 坐标 的 “三 
角形 ”类 型 即 可 ; 如 果 你 对 十 二 进 制 感 兴趣 ， 那 么 可 以 定义 你 自己 的 十 
二 进 制 类 型 。 值 得 注意 的 是 ， 要 想 自 定义 类 型 完全 发 挥 出 其 威力 ， 需 要 
有 相应 的 运算 符 和 函数 来 识别 并 配合 它 。 因 此 ， 如 果 你 自 定 义 了 一 种 特 
殊 的 数值 类 型 ， 千 万 不 要 忘 了 为 它 重 定义 配套 的 数学 运算 符 。 是 的 ， 你 
没 看 错 ，PostgreSQL 人 允许 用 户 重 定义 基础 运算 符 (+、-、/、*) 的 
实现 逻辑 。 另 外 ， 用 户 自 定义 一 种 数据 类 型 后 ，PostgreSQL 会 自动 定义 
出 一 种 基于 该 类 型 的 数组 类 型 。 因 此 ， 如 果 你 定义 了 一 种 复合 数据 类 
型 ， 那 么 该 复合 数据 类 型 的 数组 类 型 自动 就 有 了 ， 你 无 须 做 额外 的 定义 



































工作 。 


PostgreSQL 会 为 每 一 张 用 户 表 自动 创建 一 个 数据 类 型 定义 。 比 如 我 们 创 
建 了 一 张 名 为 dogs 的 表 ， 包 含 breed〈 品 种 ) 、cuteness (可 爱 程 

度 ) 、barkiness《〈 爱 叫 的 程度 ) 等 字段 ， 那 么 PostgreSQL 会 自动 在 后 台 
创建 一 个 同名 的 dogs 数据 类 型 。 这 一 特性 将 关系 型 数据 库 领 域 

的 “ 表 ” 概 念 与 面 同 对 象 领域 的 “对 象 概 念 紧密 地 联系 到 了 一 起 ， 用 户 可 
以 像 处 理 对 象 实例 一 样 去 处 理 记 录 。 比 如 你 可 以 创建 一 个 函数 来 每 次 处 
理 一 个 或 者 一 批 对 象 实例 。PostgreSQL 的 很 多 第 三 方 扩展 包 就 利用 该 上 自 
定义 数据 类 型 能 力 来 优化 性 能 ， 或 者 通过 添加 文 持 某 个 领域 专用 的 特殊 
SQL 语法 来 让 业务 代码 更 简洁 和 易于 维护 ， 或 者 实现 一 些 在 别 的 数据 库 
中 完全 不 可 能 实现 的 功能 。 


我 们 建议 用 户 不 要 把 数据 库 仅 仪 当成 一 个 数据 容器 ， 像 PostgreSQL 这 
样 的 数据 库 其 实 是 一 个 成 熟 而 完整 的 应 用 开发 平台 。 你 会 及 现 ， 强大 的 
数据 库 在 手 ， 其 他 一 切 都 是 过 眼 云烟 。 一 旦 你 成 了 SQL 高手， 别人 用 
其 他 工具 需要 几 小 时 才能 完成 的 工作 ， 你 在 数据 库 里 只 需要 几 秒 钟 。 不 
管 是 对 比 编码 时 间 还 是 对 比 实 际 数据 处 理 时 间 ， 效 果 都 是 如 此 。 


近年 来 ， 我 们 看 到 很 多 NoSQL 数据 库 异 盏 突起 ， 一 时 风头 无 两 〈 我 们 
认为 这 里 面 有 很 大 的 炒作 成 分 ) 。 尽 管 PostgreSQL 总 体 上 看 是 一 个 关 
系 型 数据 库 ， 但 它 其 实 也 具备 强大 的 处 理 非 关系 型 数据 的 能 力 。 比 如 
ltree 这 个 插件 可 以 处 理 图 数据 ， 但 我 们 几乎 已 经 想 不 起 它 到 底 是 何 时 被 
加 入 到 PostgreSQL 中 的 ; 又 比如 hstore 插件 可 以 实现 键 值 存储 还 有 
JSON 和 JSONB 类 型 可 以 提供 类 似 MongoDB 的 文档 操作 能 力 。 从 很 多 
方面 来 看 ，PostgreSQL 甚至 在 “NoSQL” 这 个 词 出 现 之 前 就 已 经 提供 了 那 
些 所 谓 的 NoSQL 特性 。 


如 果 从 Postgres95 正式 改名 为 PostgreSQL 开始 算 起 ，PostgreSQL 已 经 
诞生 二 十 年 了 ， 但 事实 上 它 的 历史 可 向 前 一 直 追 调 到 1986 年 。! 
PostgreSQL 文 持 当前 所 有 主流 的 操作 系统 ， 包 括 Linux、Unix、 
Windows 以 及 Mac。 目 前 每 年 会 发 布 一 个 大 版 本 ， 包 含 性 能 提升 以 及 那 
些 不 断 超越 关系 型 数据 库 功 能 极限 的 新 功能 。 












































1 从 1986 年 开始 ，Stonebraker 教授 发 表 了 一 系列 论文 ， 引 入 对 象 关系 理念 ， 探 讨 了 新 的 数据 
库 的 结构 设计 和 扩展 设计 。1988 年 ， 他 发 表 了 Postgres 的 第 一 个 原型 设计 ，1989 年 6 月 发 布 
了 版 本 1。 因 此 1986 年 可 视 为 PostgreSQL 发 展 史 的 元 年 。 一 一 译 者 注 











最 后 值得 一 提 的 是 ，PostgreSQL 不 但 是 开源 的 ， 而 且 开 源 得 非常 彻底 ， 
它 的 许可 策略 非常 宽松 。 现 在 PostgreSQL 社区 由 一 群 无 私 泰 献 的 的 开 
发 者 和 用 户 构成 ， 他 们 并 不 把 赚钱 视 为 人 生 终 极目 标 。 如 果 需 要 新 特 
性 ， 你 可 以 自行 页 献 代 码 或 者 提出 诉求 。 如 果 你 试图 修改 PostgreSQL 
代码 以 为 已 所用， 也 不 会 有 人 起 诉 你 。 是 成 干 上 万 用 户 的 参与 和 页 献 使 
得 PostgreSQL 变 成 了 它 今日 的 模样 。 


到 最 后 你 会 想 : 我 为 什么 还 要 使 用 别家 的 数据 库 ? PostgreSQL 已 经 提供 
了 我 所 需要 的 一 切 功能 ， 而 且 还 是 免费 的 ! 你 不 再 需要 去 阅读 那些 商业 
数据 库 附带 的 密 密 且 有 拱 的 授权 条 丈 ， 来 了 解 在 一 个 八 核 虚拟 机 上 文 持 X 
ne 也 不 需要 了 解 每 次 升级 后 要 再 为 许可 
证 加 多 少 钱 。 











1.2 不 适用 PostgreSQL 的 场景 


在 为 PostgreSQL 做 了 这 么 多 “ 误 吹 ”之 后 ， 我 们 也 应 介绍 一 下 它 不 适用 
于 哪些 场景 。 


在 不 安装 任何 扩展 包 的 情况 下 ，PostgreSQL 需 占 用 100MB 以 上 的 磁盘 
空间 ， 可 以 看 出 它 的 个 头 还 是 比较 大 的 。 因 此 ， 在 一 些 存储 空间 极为 有 
限 的 小 型 设备 上 使 用 PostgreSQL 是 不 合适 的 ， 把 PostgreSQL 当成 简单 
的 缓存 区 来 用 也 是 不 合适 的 ， 此 时 应 选用 一 些 更 轻 量 级 的 数据 库 。 


作为 一 款 企业 级 数据 库 产 品 ，PostgreSQL 对 于 安全 是 极其 重视 的 。 
此 ， 如 果 你 在 开发 一 个 把 安全 管理 放 到 应 用 层 去 做 的 轻 量 级 应 用 ， 那 么 
PostgreSQL 完善 的 安全 机 制 反 倒 会 成 为 负担 ， 因 为 它 的 角色 和 权限 管理 
非常 复杂 ， 会 带 来 不 必要 的 管理 复杂 度 和 性 能 损耗 。 此 时 可 以 考虑 选用 
SQLite 这 样 的 单 用 户 数据 库 ， 或 者 选用 FireBird 这 样 既 能 以 客户 端 / 服 
务 器 模式 运行 也 能 以 衣 入 式 单 用 户 模式 运行 的 数据 库 。 


通过 上 述 介绍 可 以 看 到 ， 一 般 来 说 需要 将 PostgreSQL 与 别 的 数据 库 搭 
配 使 用 ， 使 它们 各 展 所 长 。 一 种 常见 的 组 合 是 把 Redis 或 者 Memcache 
当成 PostgreSQL 的 查询 绥 存 来 用 ;， 男 一 种 组 合 是 用 PostgreSQL 做 主 数 
据 库 ， 用 SQLite 存储 离线 数据 来 做 离线 查询 。 


令 人 遗憾 的 一 个 事实 是 ， 很 多 共享 主 机 服务 (多 个 用 户 共 享 同一 个 操作 
系统 实例 ) 供应 商 并 不 支持 预 安装 PostgreSQL， 或 者 只 支持 安装 一 个 很 
陈旧 的 版 本 。 它 们 更 喜欢 预 装 较 弱 的 MySQL。 对 于 一 个 Web 设计 人 员 
来 说 ， 用 什么 数据 库 并 不 是 首要 问题 ， 此 时 MySQL 可 能 能 够 满足 要 
求 。 但 当 用 户 的 SQL 技能 不 断 提升 ， 不 再 满足 于 写 一 写 单 表 select 或 者 
简单 的 join 查询 时 ，MySQL 的 缺点 就 会 暴露 无 奠 。 目 本 书 第 一 版 出 版 
以 来 ， 虚 拟 化 技术 的 进步 使 得 商业 化 的 云 主 机 服务 得 到 了 长 足 的 发 展 ， 
因此 拥有 自己 的 独立 云 主 机 不 再 是 一 件 很 奢侈 的 事情 。 当 用 户 拥 有 自己 
的 独立 云 主机 时 ， 就 可 以 自由 选择 在 上 面 安装 什么 软件 。 随 着 

PaaS 平台 即 服 务 ) 、DBaaS 〈 数 据 库 即 服务 ) 等 云 计 算 模式 的 流行 ， 
PostgreSQL 的 发 展 前 景 向 好 。 绝 大 多 数 的 云 服务 三 商都 提供 
PostgreSQL 服务 ， 其 中 比较 著名 的 有 Heroku、Engine Yard、RedHat 
OpenShift、Amazon RDS for PostgreSQL、 Google Cloud SQL for 
PostgreSQL、 Amazon Aurora for PostgreSQL 以 及 Microsoft Azure for 


























PostgreSQL 。 


1.3 ”如 何 获 得 PostgreSQL 


各 干 年 前 ， 你 只 能 通过 手动 编译 源码 的 方式 来 安装 PostgreSQL。 还 好 那 
种 痛苦 的 时 代 已 经 一 去 不 复 返 了 。 当 然 ， 现 在 依然 可 以 通过 编译 源码 来 
安装 ， 但 大 多 数 用 户 会 使 用 制作 好 的 安装 包 来 安装 ， 只 需 散 击 儿 下 键盘 
和 鼠标 就 可 以 了 。 


如 条 你 是 首次 安装 PostgreSQL， 那 么 应 该 选择 适用 于 你 的 操作 系统 平台 
的 最 新 稳定 版 太行 包 。PostgreSQL 官方 站 点 的 核心 发 布 页 面 上 维护 了 一 
个 列表 ， 记 录 了 适用 于 各 操作 系统 的 二 进 制 包 的 下 载 地 址 。 在 附录 A 
中 ， 你 会 看 到 安装 指导 和 一 些 定 制版 本 的 下 载 链 接地 址 。 


1.4 管理 工具 


PostgreSQL 常用 的 管理 工具 有 四 种 : psql、pgAdmin、phpPgAdmin 和 
Adminer。PostgreSQL 的 核心 开发 团队 维护 着 前 三 种 ， 因 此 它们 一 般 会 
随 着 PostgreSQL 的 版 本 发 布 而 同步 更 新 。Adminer 并 非 PostgreSQL 的 
专用 管理 工具 ， 它 文 持 管理 多 种 类 型 的 关系 型 数据 库 ， 包 括 SQLite、 
MySQL、SQL Server 和 Oracle。 除 了 刚刚 提 到 的 这 四 种 以 外 ， 还 有 大 量 
优秀 的 管理 工具 ， 开 源 的 和 商业 的 都 有 。 





1.4.1 psdql 


psql 是 一 种 用 于 执行 查询 的 命令 行 工具 ， 每 个 PostgreSQL 发 行 版 中 都 
自 带 psql (参见 附录 B.4 节 ) 。 它 有 一 些 独 特 的 功能 ， 比 如 导入 和 导出 
基于 分 隅 从 (逗号 或 者 制 表 符 等 ) 格式 的 平面 数据 文件 ， 以 及 生成 简易 
的 HIML 格式 报表 等 。psql 是 PostgreSQL 从 诞生 之 初 就 一 直 附 带 的 命 
令 行 工 具 ， 它 是 很 多 高 级 用 户 日 常 操作 工具 的 不 二 之 选 ， 非 常 适 用 于 只 
有 控制 台 字 符 界 面 而 无 图 形 用 户 界 面 的 使 用 场景 。 另 外 ， 在 通过 shell 
脚本 执行 数据 库 操 作 时 ，psql 也 是 必 备 工具 。 不 过 新 用 户 一 般 更 喜欢 使 
儿 而 且 也 无 法 理解 为 什么 “ 老 ” 一 代 人 会 对 命令 行 方式 那 
人 人 5 


1.4.2 pgAdmin 


pgAdmin 是 一 球 流 行 的 免费 的 PostgreSQL 图 形 界 面 管理 工具 。 如 果 你 
的 PostgreSQL 安装 包 里 没有 附带 此 工具 ， 请 从 其 官网 单独 下 载 安 装 。 
pgAdmin 可 在 PostgreSQL 文 持 的 任意 一 种 操作 系统 平台 上 运行 。 


即使 你 的 数据 库 安装 在 只 有 控制 台 字 符 界 面 的 Linux 服务 器 上 ， 只 要 你 
ur 上 安装 了 pgAdmin， 也 可 以 用 这 种 强大 的 图 形 化 工具 对 其 
进行 管理 。 


pgAdmin 近期 已 经 发 布 了 它 的 第 四 个 大 版 本 ， 称 为 pgAdmin4。 该 版 本 
对 之 前 的 pgAdmin3 进行 了 彻底 的 重 写 ， 使 用 Python 实现 了 “一 套 代码 
两 种 模式 运行 ”的 效果 ， 一 种 模式 是 作为 桌面 应 用 运行 ， 另 一 种 是 在 济 
览 器 中 运行 。pgAdmin4 当前 的 版 本 是 1.5。pgAdmin4 的 首 个 版 本 是 与 
PostgreSQL 9.6 同时 发 布 的 ， 并 被 若干 PostgreSQL 发 行 版 作为 自 带 软 件 





























一 起 打包 发 布 。 如 前 所 述 ，pgAdmin4 既 可 以 作为 桌面 应 用 运行 ， 也 可 
以 在 浏览 器 中 运行 。 


图 1-1 是 pgAdmin4 的 界面 示意 图 。 





4 Browser 


日 . 埋 local 9.6 
时 上 Databases (2) 


申 - [| postgres 
日 国 postgresql_book 
由 :多 Casts 
日- 争 Catalogs (2) 
由 - 仿 ANSI (information_schema) 
一 © PostgreSQL Catalog (pg_catalog) 
申 WE Collations 
由 - 俞 Domains 
由 - 银 FTS Configurations 
申 因 Frs Dictionaries 
由 FTS Parsers 
由 - 国 FTS Templates 
申 - 哈 Foreign Tables 
申 - 时 > Functions 
由 M Materialized Views 
由 - ES Seguences 
由 - 三 Tables 
由 - 性 Trigger Functions 
由 Types 





: 由 Views 
由 .只 Event Triggers 
日 - 滞 Extensions (3) 
: -只 hstore 


i 喉 plpgsql 
由 - 司 Forelgn Data Wrappers 
由 Languages 
日 争 Schemas (3) 
由 他 census 
申 -@ public 
. 由 - 售 staging 
由 最 Login/Group Roles 


由 - 1D Tblespaces 
< 全 











Wn 


- 


图 1-1: pgAdmin4 的 树 状 视图 


如 果 你 对 PostgreSQL 还 不 太 熟 悉 ， 那 么 pgAdmin 坚 无 疑问 是 你 开始 
PostgreSQL 学 习 之 旅 的 最 佳 入 口 。 只 需 在 主 界面 上 摸索 一 下 ， 你 就 可 以 
对 PostgreSQL 的 丰 旦 功能 一 览 无 遗 。 如 果 你 正 打 算 逃 离 Microsoft SQL 
Server 阵营 ， 并 且 习 惯 于 SQL Server 的 Management Studio， 那 么 很 快 
就 能 适应 pgAdmin。 


相 比 pgAdmin3，pgAdmin4 还 有 一 些 短 板 ， 但 它 正 在 快速 补 齐 并 在 很 多 
方面 都 超过 了 pgAdmin3。 即 便 如 此 ， 如 果 你 是 PgAdmin3 的 长 期 用 户 
并 且 短 期 内 无 法 切换 到 pgAdmin4， 那 么 你 可 以 继续 使 用 BigSQL 公司 
提供 的 pgAdmin3 LTS 长 期 支持 ) 版 ， 在 对 pgAdmin4 进行 完善 测试 
后 再 切换 过 去 。 请 务必 牢记 ，pgAdmin4 才 是 pgAdmin 未 来 的 主力 版 
本 ，pgAdmin3 只 会 维持 现状 ， 不 会 再 有 什么 发 展 。 





1.4.3 phpPgAdmin 


phpPgAdmin 是 一 种 免费 的 基于 Web 页 面 的 管理 工具 ， 其 界面 如 图 1-2 
所 示 。 它 是 从 流行 的 MySQL 管理 工具 phpMyAdmin 移植 而 来 的 ， 二 者 
的 差别 主要 在 于 phpPgAdmin 新 增 了 对 PostgreSQL 的 schema、 过 程式 
语言 、 类 型 转换 医 、 运 算 符 等 对 象 的 管理 功能 。 如 果 你 对 phpMyAdmin 
很 熟悉 ， 会 发 现 phpPgAdmin 的 界面 风格 与 其 完全 类 似 。 










































































































































































…[ | example db 广 
名 a 圭 phppgadmin: 国 PostgreSQL 9.1 :下 exampl 
J-… 人 各 Schemas 
9- information_schema | 银 图 2 国 千 = 名 & 多 
十 人 pg catalog Schemas SQL Find Variables Processes Locs Admin Privileges Languages Cas 
直人 @ pg toast_ temp 1 RE 区 a 
汉 令 pubic information_schema postgres Drop | Privieges | Alter 
和 9.… 闹 | Tables 
莹 (六 pg_catalog postgres Drop | PriviEgss | Alter | System catalog schema 
Views 
三 toast 1 Drop | 
可- 乱 Sequences 三 p= | PS 
可 仿 Functions public postgres Drop | Prvieges | Alter |standard public schema 
49-… Full Text Search 
日 全 Domains Actions on multiple lines 
+ Aggregates Select all / Unselect all 一 > 一 v | Execute 
Types 
二 咯 Operators Create schema 
本 网 Op Classes 











图 1-2: phpPgAdmin 


1.4.4 Adminer 


如 果 你 正在 寻找 一 款 除了 能 够 管理 PostgreSQL， 还 能 管理 别 的 数据 库 的 
整合 型 工具 ， 那 么 Adminer 将 是 你 合适 的 选择 。Adminer 是 一 黎 轻 量 级 
的 开源 PHP 应 用 程序 ， 可 以 在 同一 套图 形 界 面 上 管理 PostgreSQL、 
MySQL、SQLite、SQL Server 以 及 Oracle 等 多 种 数据 库 。 


Adminer 有 一 种 独特 的 功能 让 我 们 印象 深刻 : 它 能 够 以 图 形 化 方式 展示 
数据 库 中 的 对 象 ， 并 将 外 键 约束 关系 以 连接 线 的 方式 展示 出 来 。 男 外 ， 
整个 Adminer 程序 的 本 体 仅 包含 一 个 PHP 文件 ， 非 常 简 洁 ， 这 可 以 大 
大 减少 你 安装 部 普 时 的 麻烦 。 


图 1-3 中 ， 左 侧 是 登录 屏幕 的 截图 ， 右 侧 是 表 间 关系 图 形 化 后 呈现 的 效 
果 。 很 多 用 户 会 因为 登录 屏幕 上 没有 填写 端口 号 的 地 方 而 感到 困惑 。 如 
果 PostgreSQL 使 用 标准 的 5432 侦 听 端口 ， 那 么 登录 时 不 填 也 没 问 题 ; 
但 如 果 不 是 ， 就 需要 在 服务 器 名 称 后 面 加 上 端口 号 ， 注 意 用 冒号 分 隔 主 
机 名 和 端口 号 ， 如 图 1-3 所 示 。 


























System PostgreSQL ~ | lu fact types 
| ED | fact_type_id 
Server localhost | category 
Username | postgres | fact_subcats 





short_name 
Password | eeeeeeeeeee 





























facts 
Database | postgresql_book FE De 
r < tract_id 
Login | 回 Permanent login i yr 
tract_id val 
tract_long_id perc 


tract_name 


图 1-3: Adminer 


对 于 简单 的 查询 和 修改 操作 来 说 ，Adminer 的 功能 是 足够 的 。 但 为 了 支 
持 多 种 数据 库 ，Adminer 的 功能 体系 已 经 被 裁剪 成 了 各 数据 库 均 支 持 的 
最 小 公共 集合 ， 因 此 你 无 法 实现 PostgreSQL 所 特有 的 一 些 操作 ， 比 如 
创建 新 用 户 、 授 予 权 限 、 查 询 当前 权限 列表 等 。Adminer 为 了 与 它 所 支 
持 的 各 家 数据 库 在 概念 上 保持 兼容 和 通用 而 将 每 个 schema 当 作 一 个 

database， 这 使 得 以 图 形 化 展示 表 与 表 之 间 外 键 关系 这 一 功能 受到 了 极 











大 影响 ， 如 果 两 个 不 同 schema 的 表 之 间 存 在 外 键 关联 关系 ， 那 么 在 
Adminer 的 界面 上 是 无 法 展示 出 来 的 。 如 有 果 你 是 DBA， 那 么 建议 使 用 
pgAdmin， 当 然 也 可 以 安装 一 套 Adminer 以 备 不 时 之 需 。 





1.5“ PostgreSQL 数据 库 对 象 


假设 你 现在 已 经 安装 好 了 PostgreSQL， 请 启动 并 连接 好 pgAdmin， 然 后 
点 开 左 侧 的 目录 树 ， 此 时 展现 在 你 面前 的 是 一 堆 令 人 眼花 综 乱 的 数据 库 
对 象 ， 有 些 你 可 能 很 熟悉 ， 有 些 则 可 能 闻所未闻 。PostgreSQL 对 象 类 型 
的 数量 超过 了 绝 大 多 数 关 系 型 数据 库 〈 这 还 是 在 未 安装 任何 扩展 包 的 情 
况 下 ) 。 这 些 对 象 中 ， 有 许多 你 可 能 永远 都 不 会 用 到 ， 但 如 果 你 发 现 业 
务 上 需要 实现 一 种 新 的 对 象 类 型 ， 那 么 一 般 来 说 你 要 实现 的 东西 在 那 一 
堆 眼 花 综 乱 的 对 象 中 己 经 有 前 人 实现 过 了 ， 所 以 只 需要 正确 选用 即 可 。 
本 书 不 会 介绍 PostgreSQL 以 标准 方式 安装 完毕 后 所 提供 的 所 有 对 象 类 
型 ， 因 为 PostgreSQL 引入 新 特性 的 速度 惊人 ， 任 何 一 本 书 都 不 可 能 
面 履 产 所 有 对 象 类 型 。 因 此 我 们 仪 讨论 你 有 必要 了 解 的 那些 对 象 类 型 。 




















database * 











? database 一 词 含义 宽泛 ， 既 可 表示 广义 的 数据 库 系统 ， 又 可 以 表示 某 些 特定 数据 库 系统 中 的 
某 一 级 数据 存储 单位 ， 如 表述 不 当 极 易 给 读者 造成 混淆 。 因 此 本 书 中 会 区 别 使 用 ， 表 示 广 义 的 
数据 库 系统 时 ， 用 中 文 “ 数 据 库 *， 表 示 狭 义 的 数据 存储 单位 时 ， 用 英文 cdatabase”。 译 者 
注 





















































每 个 PostgreSQL 服务 可 以 包含 多 个 独立 的 database。 


schema’ 
































3 数据 库 业 界 对 于 schema 有 多 种 译 法 : 纲要 、 模 式 、 方 案 ， 等 等 。 但 各 种 译 法 都 不 能 准确 直 
观 地 表达 出 其 原本 的 含义 ， 即 位 于 一 个 独立 命名 空间 内 的 一 组 相关 数据 库 对 象 的 集合 ， 因此 前 
述 译 法 从 来 没有 一 种 成 为 主流 。 一 般 业 界 人 员 都 直接 使 用 英文 schema。 考 虑 到 这 个 情况 ， 为 
防止 初级 用 户 理解 困难 ， 我 们 也 按照 业界 习惯 直接 使 用 英文 原名 。 译 者 注 










































































ANSI SQL 标准 中 对 schema 有 着 明确 的 定义 ，database 的 下 一 层 逻 
辑 结构 就 是 schema。 


如 果 把 database 比 作 一 个 国家 ， 那 么 schema 束 是 一 些 独 立 的 州 
《或 者 是 省 、 府 、 辖 区 等 ， 有 具体 取 雇 于 各 国 的 实际 情况 ) 。 大 多 数 对 象 
是 隶属 于 某 个 schema 的 ， 然 后 schema 又 隶属 于 某 个 database。 在 创建 
一 个 新 的 database 时 ，PostgreSQL 会 自动 为 其 创建 一 个 名 为 public 的 
schema。 如 果 未 设置 search_path 变量 〈 后 续 会 介绍 该 变量 的 含 
义 ) ， 那 么 PostgreSQL 会 将 你 创建 的 所 有 对 象 默认 放 入 public schema 


中 。 如 果 表 的 数量 较 少 ， 这 是 没 问题 的 ， 但 如 果 你 有 几 干 张 表 ， 那 么 我 
们 还 是 建议 你 将 它们 分 门 别 类 放 入 不 同 的 schema 中 。 


表 





任何 一 个 数据 库 中 ， 表 都 是 最 核心 的 对 象 类 型 。 在 PostgreSQL 
中 ， 表 首先 属于 某 个 schema， 而 schema 又 属于 某 个 database， 这 样 就 
构成 了 一 种 三 级 存储 结构 。 


PostgreSQL 的 表 文 持 两 种 很 强大 的 功能 。 第 一 种 是 表 继 承 ， 即 一 张 
表 可 以 有 父 表 和 子 表 。 这 种 层次 化 的 结构 可 以 极 大 地 简化 数据 库 设计 ， 
还 可 以 为 你 省 掉 大 量 的 重复 查询 代码 。 第 二 种 是 创建 一 张 表 的 同时 ， 系 
统 会 自动 为 此 表 创 建 一 种 对 应 的 自 定义 数据 类 型 。 


视图 


大 多 数 关 系 型 数据 库 都 支持 视图 。 视 图 是 基于 表 的 一 种 抽象 ， 通 过 
它 可 以 实现 一 次 性 得 询 多 张 表 ， 也 可 以 实现 通过 复杂 运算 来 构造 出 虚拟 
字段 。 视 图 一 般 是 只 读 的 ， 但 PostgreSQL 支持 对 视图 数据 进行 修改 ， 
前 提 是 该 视图 基于 单 张 实体 表 构 建 。 如 果 需 要 修改 基于 多 张 表 关 联 而 来 
的 视图 ， 可 以 针对 视图 编写 触发 器 。9.3 版 还 引入 了 对 物化 视图 的 文 
持 ， 该 机 制 通过 对 视图 数据 进行 缓存 来 实现 对 常用 查询 的 加 速 ， 缺 点 是 
碍 到 的 数据 可 能 不 是 最 新 的 。 更 多 细节 请 参见 7.1.3 节 。 


扩展 包 


开发 人 员 可 以 通过 该 机 制 将 一 组 相关 的 函数 、 数 据 类 型 、 数 据 类 型 
转换 器 、 用 户 自 定义 索引 、 表 以 及 属性 变量 等 对 象 打 包 成 一 个 功能 扩展 
包 ， 该 扩展 包 可 以 整体 安装 和 删除 。 扩 展 包 在 概念 上 与 Oracle 的 
package 类 似 ， 从 PostgreSQL 9.1 版 本 之 后 一 般 推 荐 使 用 该 机 制 来 为 数 
据 库 提 供 功 能 扩展 。 扩 展 包 的 具体 安装 步骤 ， 请 参考 开发 手册 。 一 般 来 
说 ， 需 要 驳 将 扩展 包 的 二 进 制 安装 包 和 脚本 复制 到 PostgreSQL 安装 目 
录 下 ， 然 后 运行 一 系列 脚本 ， 再 在 需要 其 功能 的 database 中 单独 安装 该 
扩展 包 。 注 意 : 仅 需 在 需要 该 扩展 包 功 能 的 database 中 安装 ， 不 必 为 当 
前 数据 库 系 统 中 的 每 个 database 都 安装 。 比 如 需要 对 某 个 database 中 的 
数据 进行 高 级 文本 搜索 ， 那 么 单独 在 该 database 中 安装 
fuzzystrmatch 扩展 包 即 可 。 




































































安装 扩展 包 时 可 以 指定 该 包 中 所 含有 的 成 员 对 象 安装 到 哪个 
schema， 知 不 指定 则 默认 会 安装 到 public schema 中 。 我 们 不 建议 采用 
默认 设置 ， 因 为 这 会 导致 public schema 变 得 庞大 复杂 且 难 以 管理 ， 尤 
其 是 如 果 你 将 自己 的 数据 库 对 象 也 都 存 入 public schema 中 ， 那 么 情况 
会 变 得 更 糟糕 。 我 们 建议 你 创建 一 个 独立 的 schema 用 于 存放 所 有 扩展 
包 的 对 象 ， 甚 至 为 规模 较 大 的 扩展 包 单 独创 建 一 个 shema。 为 避免 出 
现 找 不 到 新 增 扩 展 包 对 象 的 问题 ， 请 将 这 些 新 增 的 schema 名 称 加 入 
search_path 变量 中 ， 这 样 就 可 以 直接 使 用 扩展 包 的 功能 而 无 须 关 注 
它 到 底 安 装 到 了 哪个 schema 中。 也 有 一 些 扩 展 包 明确 要 求 必 须 安 装 到 
某 个 schema 下 《特别 是 过 程式 语言 扩展 包 ) ， 这 种 情况 下 你 就 不 能 自 
行 指定 了 。 有 很 多 语言 扩展 包 ， 比 如 pLv8 ， 就 要 求 必 须 安装 到 
pg_catalog schema 中 。 


多 个 扩展 包 之 间 可 能 存在 依赖 关系 。 在 PostgreSQL 9.6 之 前 ， 你 需 
要 了 解 这 个 依赖 关系 并 把 被 依赖 包 先 装 好 ， 但 从 9.6 版 开始 ， 只 需 在 安 
装 时 加 上 cascade 关键 字 ，PostgreSQL 就 会 自动 安装 当前 扩展 包 所 依 
赖 的 扩展 包 。 例 如 : 


CREATE EXTENSION postgis tiger geocoder CASCADE; 


这 条 命令 会 先 寻 找 并 安装 被 依赖 的 postgis 和 fuzzystrmatch 这 
两 个 扩展 包 ， 当 然 ， 如 果 原 本 就 有 了 ， 融 不 需要 了 。 


函数 


用 户 可 以 编写 自 定义 函数 来 对 数据 进行 新 增 、 修 改 、 删 除 和 复杂 计 
算 等 操作 ， 可 以 使 用 PostgreSQL 所 文 持 的 各 种 过 程式 语言 来 编码 。 
PostgreSQL 装 好 以 后 自身 就 包含 了 数 以 干 计 的 系统 函数 ， 都 在 默认 的 
postgres 库 中 。 函 数 文 持 返 回 以 下 数据 类 型 : 标量 值 〈 也 就 是 单个 
值 ) 、 数 组 、 单 条 记录 以 及 记录 集 。 其 他 数据 库 将 对 数据 进行 增删 改 操 
作 的 函数 称 为 “存储 过 程 >， 把 不 进行 增删 改 的 函数 叫 作 “函数 "”， 但 
PostgreSQL 中 并 不 区 分 ， 统 一 把 二 者 称 为 “函数 ”。 


内 置 编 程 语言 
函数 是 以 过 程式 语言 编写 的 。PostgreSQL 默认 支持 三 种 内 置 编程 语 
































言 : SQL、PL/pgSQL 以 及 C 语言 。 可 以 通过 CREATE EXTENSION 或 者 
CREATE PRODCEDURAL LANGUAGE 命令 来 添加 其 他 语言 。 目 前 较 常 用 的 
语言 是 PL/Python、PL/V8〔 即 JavaScript〉 以 及 PL/R。 我 们 将 在 第 8 章 
中 展示 大 量 的 相关 示例 。 


算 符 


运算 符 本 质 上 是 以 简单 符号 形式 呈现 的 函数 别名 ， 例 如 = 、&& 
等 。PostgreSQL 文 持 自 定义 运算 符 。 如 果 用 户 定义 了 自己 的 数据 类 型 ， 
那么 一 般 来 说 需要 再 自 定 义 一 些 运算 符 来 与 之 配合 工作 。 比 如 你 定义 了 
一 个 复数 类 型 ， 那 么 你 很 有 可 能 需要 上 自 定 义 +、- 、* 、/ 这 几 个 运算 
符 来 对 复数 进行 运算 。 


外 部 表 和 外 部 数据 封装 器 


外 部 表 是 一 些 虚 拟 表 ， 通 过 它们 可 以 直接 在 本 地 数据 库 中 访问 来 自 
外 部 数据 源 的 数据 。 只 要 数据 映射 关系 配置 正确 ， 外 部 表 的 用 法 就 与 普 
通 表 没有 任何 区 别 。 外 部 表 文 持 映射 到 以 下 类 型 的 数据 源 : CSYV 文件 、 
男 一 个 服务 器 上 的 PostgreSQL 表 、SQL Server 或 Oracle 这 些 异 构 数据 
库 中 的 表 、Redis 这 样 的 NoSQL 数据 库 ， 甚 至 像 Twitter 或 Salesforce 
这 样 的 Web 服务 。 


外 部 表 上 映射 关系 的 建立 是 通过 配置 外 部 数据 封装 器 (foreign data 
wrapper，FDW) 实现 的 。FDW 是 PostgreSQL 和 外 部 数据 源 之 间 的 一 
架 “ 魔 法 桥 ?”， 可 实现 两 边 数据 的 互联 互通 。 其 内 部 实现 机 制 遭 循 SQL 
标准 中 的 MED (Management of External Data) 规范 ， 更 多 细节 请 参考 
维基 百科 上 关于 MED 的 描述 。 


许多 无 私 的 开发 者 已 经 为 当下 大 部 分 流行 的 数据 源 开发 了 FDW 并 
已 免费 共 享 出 来 。 你 也 可 以 通过 创建 自己 的 EDW 来 练习 。【〔 我 们 建议 
你 一 旦 成 功 了 也 公布 出 来 ， 这 样 整 个 社区 都 可 以 分 享 你 的 劳动 成 果 。) 
FDW 是 通过 扩展 包机 制 实现 的 ， 安 装 好 以 后 在 pgAdmin 界面 上 名 为 
Foreign Data Wrapper 的 目录 节点 下 能 看 到 它 。 


触 太 占 和 触及 器 函 数 


绝 大 多 数 企业 级 数据 库 都 文 持 触 发 右 机 制 ， 该 机 制 可 以 侦 测 到 数据 
修改 事件 的 发 生 。 在 PostgreSQL 中 ， 当 一 个 触发 右 被 触发 后 ， 系 统 会 
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自动 调用 用 户 定 义 好 的 触发 器 函数 。 触 发 器 的 触发 时 机 是 可 设置 的 ， 可 
以 是 语句 级 触发 或 者 记录 级 触发 ， 也 可 以 是 修改 前 触发 或 修改 后 触发 。 


在 pgAdmin 中 ， 如 果 和 希望 了 解 哪 些 表 上 挂 载 了 触 友 右 ， 只 需 在 对 
象 树 上 层 层 点 击 ， 一 直 打 开 到 表 这 一 级 ， 然 后 可 以 看 到 下 面 有 个 trigger 
子 栏目 ， 里 面 就 是 该 表 的 所 有 触发 器 。 


定义 触发 右 时 需要 定义 对 应 的 触及 器 函数 ， 这 类 函数 与 前 面 介绍 过 
的 普通 函数 有 所 不 同 ， 主 要 差异 在 于 触发 器 函数 可 以 通过 系统 内 置 变 量 
来 同时 访问 到 修改 前 和 修改 后 的 数据 ， 这 样 就 可 以 实现 对 于 非法 的 数据 
修改 行为 的 识别 和 拦截 。 因 此 触发 絮 函 数 一 般 会 用 于 编写 复杂 校 验 逻 
辑 ， 这 类 复杂 逻辑 通过 check 约束 是 无 法 实现 的 。 


PostgreSQL 的 触 上 友 器 技术 正在 快速 的 演进 之 中 。9.0 版 引入 了 对 
WITH 子 句 的 支持 ， 通 过 它 可 以 实现 市 条 件 的 记录 级 触发 ， 即 只 有 当 某 
条 记录 符合 指定 的 WHEN 条 件 时 ， 触 发 器 才 会 被 调用 。9.0 版 还 引入 了 
UPDATE OF 子 句 ， 通 过 它 可 以 实现 精确 到 字段 级 的 触发 条 件 设 置 。 仅 当 
指定 的 字段 内 容 被 更 改 时 才 会 激活 触发 吉 。9.1 版 文 持 了 针对 视图 的 触 
发 堪 。9.3 版 文 持 了 针对 DDL 的 触发 器 。 目 前 支持 触发 器 的 DDL 命令 
列表 请 参见 官方 手册 中 “触发 器 触发 时 机 一 览 表 >”。pgAdmin 中 会 把 
DDL 触发 器 列 在 event trigger 这 一 栏 下 。 最 后 值得 一 提 的 是 ， 从 9.4 版 
开始 ， 针 对 外 部 表 的 触发 右 也 获得 了 文 持 。 


























catalog 4 
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4 catalog 的 译 法 与 schema 存在 相同 的 问题 ， 翻 译 为 目录 ”后 并 不 能 让 读者 准确 地 理 角 
意 ， 反 而 容易 造成 混 消 ， 因 此 还 是 沿用 英文 原名 。 一 -一 译 者 注 























catalog 是 系统 级 的 schema， 用 于 存储 系统 函数 和 系统 元 数据 。 
个 database 创建 好 以 后 默认 都 会 含有 两 个 catalog: 一 个 名 为 
pg_catalog ， 用 于 存储 PostgreSQL 系统 自 带 的 函数 、 表 、 系 统 视 图 、 
数据 类 型 转换 器 以 及 数据 类 型 定义 等 元 数据 ， 另 一 个 是 
information_schema ， 用 于 存储 ANSI 标准 中 所 要 求 提供 的 元 数据 查 
询 视图 ， 这 些 视图 遵从 ANSI SQL 标准 的 要 求 ， 以 指定 的 格式 向 外 界 提 
供 PostgreSQL 元 数据 信息 。 


一 直 以 来 ，PostgreSQL 数据 库 的 发 展 都 严格 地 遵循 着 其 “自由 与 开 
放 ” 的 核心 理念 。 如 果 你 足够 了 解 这 天 数据 库 ， 会 发 现 它 几乎 是 一 种 可 











以 “自我 生长 * 的 数据 库 。 比 如 ， 它 所 有 的 核心 设置 都 保存 在 系统 表 中 ， 
用 户 可 以 不 受 限 地 查看 和 修改 这 些 数 据 ， 这 为 PostgreSQL 提供 了 远 超 
任何 一 种 商业 数据 库 的 巨大 灵活 性 (不 过 从 为 一 个 角度 看 ， 将 这 种 灵活 
性 称 为 “可 破坏 性 ”也 未 尝 不 可 ) 。 只 要 仔细 地 研究 一 下 pg_catalog ， 
你 就 可 以 了 解 到 PostgreSQL 这 样 一 个 庞大 的 系统 是 如 何 基 于 各 种 部 件 
构建 起 来 的 。 如 果 你 有 超级 用 户 权 限 ， 那 么 可 以 直接 修改 pg_catalog 
2 (当然 ， 如 果 改 得 不 对 ， 那 你 的 行为 就 跟 搞 破 坏 没 什么 两 样 
由 


Information_schema catalog 在 MySQL 和 SQL Server 中 也 有 。 
PostgreSQL 的 Information_schema 中 最 常用 的 视图 一 般 有 以 下 几 
个 : columns 视图 ， 列 出 了 数据 库 中 的 所 有 字段 ， tables 视图 ， 列 出 
了 数据 库 中 的 所 有 表 〈 包 括 视图 ) ; views 视图 ， 列 出 了 所 有 视图 以 及 
用 于 创建 该 视图 的 原始 SQL。 


类 型 


类 型 是 数据 类 型 的 简称 。 每 种 数据 库 产 品 和 每 种 编程 语言 都 会 文 持 
一 系列 的 数据 类 型 ， 比 如 整 型 、 字 符 型 、 数 组 、 二 进 制 大 对 象 〔blob) 
等 。 除 前 述 常 见 类 型 外 ，PostgreSQL 还 支持 复合 数据 类 型 ， 这 种 类 型 可 
以 是 多 种 数据 类 型 的 一 个 组 合 ， 比 如 复数 、 极 坐标 、 向 量 、 张 量 等 都 是 
复合 数据 类 型 。 


PostgreSQL 会 自动 为 用 户 自 己 创建 的 表 定 义 一 个 同名 的 复合 数据 类 
型 。 这 样 就 可 以 把 表 记 录 当 作对 象 实例 来 处 理 。 当 用 户 需 要 在 函数 中 通 
历 表 记 录 时 ， 访 特性 特别 有 用 。 注 意 : 在 pgAdmin 的 界面 上 你 看 不 到 
ee 目 动 生成 的 自 定义 类 型 ， 但 请 放心 ， 这 并 不 代表 它们 不 
子 仁 。 


全 文 检索 


全 文 检索 (full text search，FTS) 是 一 种 基于 自然 语言 的 搜索 机 
制 。 这 种 搜索 机 制 有 一 些 “ 智 能 ”成 分 。 与 正则 表达 式 搜索 不 同 ， 全 文 检 
过 能 够 基于 语义 来 进行 匹配 得 找 ， 而 不 仅仅 是 纯粹 的 语法 匹配 。 例 如 ， 
用 户 需 要 在 一 段 长 文本 中 搜索 running 这 个 词 ， 那 么 命中 的 结果 可 能 
含 rn、running、jog、sprint、dash 等 词 。 全 文 检索 功能 依赖 于 FTS 配 
置 库 、FTS 词典 、FTS 解析 器 这 三 个 部 件 。 有 了 它们 ，PostgreSQL 原生 
的 FTS 功能 即 可 正常 使 用 。 一 般 场 景 下 的 全 文 检索 徘 这 三 个 原生 部 件 


























已 经 足够 ， 但 在 涉及 药理 学 、 有 组 织 犯罪 学 等 专业 场景 下 ， 搜 索 目 标 文 
本 中 会 包括 该 领域 专 有 词汇 和 特殊 语法 规则 ， 此 时 需要 用 专门 的 FTS 
部 件 来 蔡 换 原生 FTS 部 件 。 我 们 会 在 5.8 节 探 讨 FTS 功能 。 


数据 类 型 转换 器 


数据 类 型 转换 器 可 以 将 一 种 数据 类 型 转换 为 男 一 种 ， 其 底层 通过 调 
用 转换 函数 来 实现 真正 的 转换 逻辑 。PostgreSQL 支持 用 户 自 定义 转换 器 
或 者 重 载 、 加 强 默 认 的 转换 器 。 例 如 ， 如 果 你 需要 把 邮政 编码 (美国 的 
邮政 编码 是 一 个 5 位 的 整数 ) 从 integer 转换 为 character ， 那 么 可 
以 自 定义 一 个 支持 “数字 不 足 5 位 则 前 面 自动 补 0” 规 则 的 转换 器 。 


转换 器 可 以 被 隐 式 调用 也 可 以 被 显 式 调用 。 隐 式 转换 是 系统 目 动 执 
行 的 ， 一 般 来 说 ， 将 一 种 特定 数据 类 型 转 为 更 通用 的 数据 类 型 〈 比 如 数 
字 转 换 为 字符 串 ) 时 就 会 发 生 隐 式 类 型 转换 。 如 果 进 行 隐 式 转换 时 系统 
找 不 到 合适 的 转换 上 器， 你 束 必 须 显 式 执行 转换 动作 。 


序列 写生 成 器 


序列 号 生成 器 用 于 实现 serial 数据 类 型 值 的 自动 递增 分 配 。 在 创 
建 serial 字段 时 ，PostgreSQL 会 目 动 为 其 创建 一 个 相应 的 序列 号 生成 
器 ， 但 用 户 也 可 以 很 方便 地 更 改 其 初始 值 、 步 长 和 下 一 个 值 。 因 为 序列 
号 生成 器 是 独立 对 象 ， 所 以 多 个 表 可 以 共 齐 同一 个 序列 号 生成 项 。 基 于 
该 机 制 ， 用 户 可 以 实现 跨越 多 个 表 的 唯一 键 。SQL Server 和 Oracle 也 都 
文 持 序列 号 生成 器 ， 但 必须 手动 创建 。 


规则 


规则 的 功能 是 在 一 个 SQL 执行 前 对 其 进行 改写 。 本 书 中 不 会 讨论 
有 关 规 则 的 内 容 ， 因 为 这 一 技术 已 经 过 时 ， 通 过 触发 器 能 实现 相同 的 功 
能 。 























PostgreSQL 人 允许 用 户 对 前 述 每 一 种 对 象 进行 参数 配置 。 这 些 参数 可 以 在 
服务 级 、 库 级 、 函 数 级 等 不 同 层级 生效 。 你 将 来 很 可 能 会 看 到 一 个 很 炫 
的 词 叫 GUC， 意 思 是 “大 一 统 配置 ”(grand unified configuration)， 它 
实际 上 指 的 就 是 PostgreSQL 中 的 那些 配置 参数 。 





1.6 最 新 版 本 的 PostgreSQL 中 引入 的 新 特性 


PostgreSQL 在 每 年 的 9 月 份 会 发 布 一 个 大 版 本 。 每 个 新 版 本 都 会 带 来 稳 
定性 、 安 全 性 、 性 能 等 方面 的 提升 ， 以 及 一 些 前 治 的 新 特性 。 而 且 版 本 
升级 过 程 也 变 得 越 来 越 简单 。 那 么 显而易见 ， 请 尽量 把 你 的 数据 库 及 时 
升级 到 最 新 的 稳定 版 。 关 于 每 个 版 本 引入 的 关键 特性 列表 ， 请 参见 官方 
提供 的 “PostgreSQL 各 版 本 功能 特性 一 览 表 ”。 


1.6.1 为 什么 要 升级 


如 果 你 正在 使 用 PostgreSQL 9.1 或 者 更 早 的 版 本 ， 请 立即 升级 ! 因为 
9.1 版 在 2016 年 9 月 已 进入 生命 周期 终结 (end of life，EOL ) 状态 。 请 
参考 PostgreSQL 官方 的 发 行 版 文 持 策略 以 获取 更 多 关于 PostgreSQL 
EOL 政策 的 细节 。 请 务必 不 要 使 用 已 过 了 EOL 期 限 的 版 本 ， 因 为 开发 
组 不 会 再 为 其 提供 新 的 安全 更 新 和 功能 补丁 。 一 旦 这 种 老 版 本 出 了 问 
题 ， 你 只 能 花 钱 去 请 PostgreSQL 专家 级 顾问 来 解决 故障 或 寻找 临时 解 
决 方案 ， 这 种 服务 一 般 都 是 很 郧 贵 的 ， 而 且 你 不 一 定 能 找 得 到 这 种 专 
系 。 

















不 管 当前 使 用 的 是 哪个 大 版 本 ， 你 都 应 该 尽快 跟 进 小 版 本 号 的 更 新 。 比 
如 从 9.1.17 升级 到 9.1.21， 只 需要 蔡 换 二 进 制 文件 并 重 局 一 下 即 可 。 小 
版 本 仅 修 改 bug 而 不 会 涉及 功能 变化 ， 因 此 这 种 升级 是 很 安全 的 ， 也 会 
为 你 降低 出 问题 的 概率 。 


1.6.2 PostgreSQL 10 中 引入 的 新 特性 


PostgreSQL 10 是 目前 最 新 的 稳定 版 ， 于 2017 年 10 月 发 布 。 从 
PostgreSQL 10 开始 ，PostgreSQL 会 以 一 种 新 的 方式 升级 其 版 本 号。 在 
之 前 的 版 本 中 ， 发 布 大 版 本 时 变化 的 是 第 二 位 小 版 本 号 ， 比 如 从 
PostgreSQL 9.5 到 PostgreSQL 9.6， 即 使 增加 了 一 些 比较 大 的 新 功能 ， 
也 只 有 小 版 本 号 发 生变 化 。 但 从 PostgreSQL 10 开始 ， 每 个 变化 较 大 的 
版 本 都 会 在 主 版 本 号 上 加 一 。 因 此 PostgreSQL 10 的 下 一 个 大 版 本 是 
PostgreSQL 11。 这 样 就 与 SQLite、SQL Server、Oracle 等 数据 库 的 版 本 
号 策略 保持 了 一 致 。 


以 下 是 PostgreSQL 10 中 引入 的 关键 新 特性 。 











提升 了 碍 询 的 并 行 度 


对 于 并 行 查 询 局 用 了 新 的 优化 策略 ， 包 括 并 行 位 图 堆 扫 描 、 并 行 索 
引 扫描 等 。 这 些 增强 将 使 得 更 多 查询 语句 能 被 并 行 执行 。 请 参考 9.4 节 
以 了 解 更 多 信息 。 


逻辑 复制 


此 前 版 本 的 PostgreSQL 中 已 经 文 持 流 复制 特性 。 通 过 流 复制 可 以 
实现 整个 PostgreSQL 服务 实例 的 复制 ， 但 该 机 制 有 一 些 固有 的 缺点 : 
从 节点 是 只 读 的 ， 只 能 用 于 数据 查询 ， 不 能 对 其 数据 进行 修改 ;， 从 节点 
上 也 不 能 创建 目 己 独 有 的 表 。 逻 辑 复制 解决 了 这 两 个 问题 。 通 过 逻辑 复 
制 可 以 实现 仅 复 制 单 张 表 或 者 单个 database (不 用 复制 整个 服务 实例 的 
所 有 数据 ) 。 既 然 不 需要 复制 整个 数据 库 服务 ， 那 么 上 自然 从 库 上 束 可 以 
a 这 部 分 数据 是 不 包含 在 复制 体系 中 的 ， 因 此 主 从 库 

许 不 一 样 。 


针对 JSON 和 JSONB 类 型 的 全 文 检索 


此 前 的 版 本 中 ，to_tsvector 函数 仅 能 为 文本 类 型 的 字段 生成 全 
文 检索 向 量 。 现 在 它 已 支持 处 理 JSON 和 JSONB 类 型 ， 处 理 过程 中 会 
忽略 其 中 key 的 部 分 ， 而 仪 包含 value 的 部 分 。 同 时 ts_headline 函数 
也 专 为 JSON 和 JSONB 类 型 做 了 适 配 ， 它 可 以 对 JSON 内 容 中 的 关键 
字 进 行 加 亮 标记 。 详 情 请 参考 5.8.7 节 。 














支持 ANSI 标准 中 的 XMLTABLE 特性 


XMLTABLE 特性 可 以 将 XML 文本 内 容 以 一 种 更 为 简单 的 方式 映射 
为 普通 二 维 表 记录 。 该 特性 在 Oracle 和 IBM DB2 中 已 支持 。 详 情 请 参 
见 示例 5-41。 


FDW 聚合 下 推 


FDW API 可 以 将 COUNT(*) 或 者 SUM(* ) 这 种 聚合 操作 推送 到 远 端 
节点 执行 。postgres_fdw 插件 从 该 特性 中 受益 最 大 。 此 前 的 版 本 
中 ，postgres_fdw 插件 在 执行 聚合 操作 时 ， 需 要 把 所 有 相关 数据 从 远 
端 PostgreSQL 取 到 本 地 然后 再 进行 聚合 运算 ， 这 极 大 地 影响 了 整体 运 
算 效 率 





声明 式 表 分 区 


此 前 的 版 本 中 ， 实 现 分 区 表 功 能 需要 借助 表 继 承 机 制 。 表 继承 机 制 
的 问题 在 于 ， 用 户 需 要 上 自行 编写 触 故 器 来 实现 把 数据 分 流 到 子 表 中 的 过 
程 。PostgreSQL 10 引入 了 PARTITION BY 语法 ， 利 用 该 语法 ， 用 户 只 
需 在 创建 表 时 附加 PARTITION BY 子 句 就 可 以 自动 实现 表 分 区 。 此 后 向 
父 表 插 入 数据 时 ， 数 据 会 被 分 流 到 子 表 中 ， 这 一 切 都 是 自动 的 ， 无 须 用 
户 预 完 创 建 触发 器 。 请 参考 6.1.3 节 以 了 解 详 情 。 


查询 性 能 优化 
该 版 本 中 对 碍 询 性 能 实现 了 多 方面 的 优化 。 
文 持 创 建 多 字段 统计 信息 


CREATE STATISTICS 命令 支持 针对 多 个 字段 建立 统计 信息 。 有 具体 
请 参见 示例 9-18。 


支持 IDENTITY 数据 类 型 
新 增 支 持 IDENTITY 自 增 字段 类 型 ， 创 建 表 和 修改 表 结 构 时 都 可 以 


使 用 。 增 加 该 类 型 是 为 了 在 设计 表 的 目 增 字段 时 更 加 符合 业界 通行 做 
法 。 有 基体 请 参见 示例 6-2。 














1.6.3 “PostgreSQL 9.6 中 引入 的 新 特性 
PostgreSQL 9.6 发 布 于 2016 年 9 月 ， 是 9.x 系列 中 的 最 新 版 本 。 
文 持 并 行 查 询 


9.6 版 之 前 ，PostgreSQL 并 不 能 充分 地 利用 系统 中 的 多 核能 力 。9.6 
版 中 ，PostgreSQL 引擎 能 够 将 一 些 特定 类 型 的 查询 语句 放 到 多 个 处 理 器 
核心 上 并 行 执行 。 文 持 并 行 执行 的 操作 有 : 顺序 扫 摘 、 部 分 join 以 及 部 
分 聚合 操作 。 然 而 ， 增 删改 这 些 修改 数据 的 操作 无 法 实现 并 行 。 文 持 并 
行 化 的 工作 还 在 进行 中 ， 最 终 目 标 是 所 有 的 语句 都 能 利用 到 多 核 并 行 执 
行 。 详 情 参 见 9.4 闻 。 


支持 关联 词组 全 文 检索 











全 文 检索 支持 关联 词组 搜索 ， 可 以 使 用 <-> 运算 符 来 表示 两 个 关联 
词 之 则 的 距离 。 即 使 关联 词 没 有 连 在 一 起 出 现 ， 只 要 二 者 出 现 的 位 置 不 
超出 前 述 距 离 ， 也 认为 该 关联 词组 搜索 命中 。 在 9.6 之 前 的 版 本 中 ， 

能 搜索 一 些 单个 的 词 ， 但 该 功能 使 得 用 户 可 以 搜索 一 组 有 人 
组 。 详 情 请 参见 5.8 节 。 


psql 工具 支持 \gexec 参数 


该 参数 的 功能 是 读 取 并 执行 一 个 根据 查询 语句 动态 生成 的 SQL。 详 
情 请 参见 3.4.5 节 。 











postgres_fdw 增强 


对 于 简单 的 更 新 、 插 入 和 删除 来 说 ， 速 度 有 很 大 提升 。 请 参考 博 
文 “Directly Modify Foreign Tables” 以 了 解 详情 。 


FDW 关联 操作 下 推 


包括 postgres_fdw 在 内 的 部 分 FDW 已 支持 该 特性 。 当 需要 对 多 
张 外 表 做 关联 查询 时 ， 之 前 的 做 法 是 把 每 张 外 表 的 数据 取 回 本 地 然后 做 
关联 计算 ， 支 持 了 该 特性 的 FDW 的 优化 处 理 方式 是 : 如 果 需 要 关联 的 
两 张 外 表 都 来 自 于 同一 台 外 部 服务 器 ， 那 么 就 把 join 操作 下 推 到 这 个 外 
部 服务 器 上 去 执行 ， 然 后 仅 把 关联 结果 拿 回 来 。 这 样 可 以 极 大 地 减少 经 
网 络 传输 的 记录 数 。 当 关联 操作 可 以 过 滤 掉 大 量 数 据 时 ， 这 个 特性 带 来 
的 性 能 提升 是 巨大 的 。 








1.6.4 PostgreSQL 9.5 中 引入 的 新 特性 
PostgreSQL 9.5 发 布 于 2016 年 1 月， 其 主要 的 新 特性 如 下 。 
外 部 表 架 构 的 改进 

支持 了 新 的 IMPORT FOREIGN SCHEMA 命令 ， 通 过 该 命令 可 以 从 外 
部 服务 右 中 加 载 表 结构 信息 从 而 实现 批量 创建 外 表 。 支 持 外 表 继 承 ， 本 
地 表 可 以 继承 自 外 表 ， 外 表 也 可 以 继承 自 本 地 表 ， 外 表 也 可 以 继承 目 羽 
一 张 外 表 。 支 持 在 外 表 上 创建 约束 。 详 情 请 参见 10.3 节 和 10.3.3 节 。 


支持 无 日 志 表 直接 升级 为 日 志 表 

















由 于 无 日 志 表 不 写 日 志 ， 往 其 中 导入 数据 时 会 很 快 ， 但 缺点 是 数据 
库 骨 演 时 会 完全 丢失 数据 。 在 此 前 的 版 本 中 ， 当 数据 完全 导入 无 日 志 表 
后 ， 要 想 把 无 日 志 表 改 为 日 志 表 需要 创建 一 张 新 表 ， 然 后 再 把 无 日 志 表 
的 数据 写 入 新 表 。9.5 版 提供 了 一 个 新 的 语法 : ALTER TABLE ... SET 
UNLOGGED ， 可 以 直接 把 无 日 志 表 修改 为 日 志 表 ， 这 样 束 省 去 了 重新 建 
表 并 搬迁 数据 的 过 程 。 


array_agg 亲 数 文 持 数组 入 参 

array_agg 函数 可 以 将 某 字段 的 多 条 记录 聚合 为 一 个 数组 。 在 9.5 
版 之 前 ， 入 参 字段 类 型 不 能 是 一 个 数组 ， 但 9.5 版 之 后 支持 输入 数组 入 
参 ， 这 样 就 可 以 构造 出 多 维 数 组 。 详 情 请 参见 示例 5-17。 
支持 BRIN 索引 类 型 

BRIN (block range index) 是 一 种 新 型 的 索引 ， 相 比 B- 树 和 GIN 索 
引 有 着 更 小 的 内 存 占 用 。 有 些 情况 下 BRIN 索引 会 比 前 述 两 种 索引 速度 
更 快 。 详 情 请 参见 6.3 节 。 
支持 GROUPING SETS 、ROLLUP 和 CUBE 聚合 语法 


该 特性 用 于 聚合 查询 语句 中 ， 可 以 实现 一 次 性 获取 多 维度 汇聚 结 
果 。 具 体例 子 请 参见 7.7 节 。 


仅 索 引 扫 描 

如 果 要 查询 的 字段 在 索引 中 已 经 全 部 包含 ， 则 仅 扫 描 索 引 即 可 获得 
查询 结果 ， 而 不 用 访问 表 数 据 ， 这 种 查询 模式 称 为 “ 仅 索 引 扫 描 ”。 当 前 
只 有 GiST 索引 文 持 此 特性 。 

文 持 “无 则 插入 有 则 更 新 ?处理 〈 即 UPSERT 能 力 ) 

9.5 版 之 前 ， 如 果 插 入 或 者 更 新 操作 违反 了 主键 约束 或 者 其 他 约 
束 ， 那 么 该 操作 会 失败 。9.5 版 提供 了 一 种 机 制 ， 人 允许 用 户 捕 获 该 异常 
并 自 定义 蔡 代 操作 或 者 跳 过 引发 问题 的 记录 。 详 情 请 参见 7.2.11 节 。 
支持 跳 过 无 法 写 锁 定 的 记录 

如 果 用 户 和 希望 锁定 一 些 记录 以 用 于 后 续 更 新 ， 那 么 可 以 使 用 























SELECT ..。FOR UPDATE 来 锁定 这 些 记 录 。 在 9.5 版 之 前 ， 如 果 试 图 
锁定 的 部 分 或 者 全 部 记录 已 被 其 他 用 户 锁定 ， 那 么 当前 用 户 的 锁定 操作 
就 会 报错 。9.5 版 中 提供 了 一 个 SKIP LOCKED 子 句 语 法， 可 以 跳 过 那些 
己 经 被 别人 锁定 的 记录 ， 这 样 就 不 会 报错 。 
行 级 安全 控制 

支持 对 用 户 设 置 记录 级 的 读 写 权限 ， 即 同一 张 表 中 ， 部 分 记录 只 人 允 
许 某 个 用 户 读 写 ， 另 外 一 部 分 记录 只 允许 另外 一 个 用 户 读 写 。 在 多 租户 


场景 下 ， 显 然 该 功能 是 特别 有 用 的 ; 对 于 需要 进行 访问 权限 陋 离 而 义 无 
法 通过 分 表 实 现 的 场景 ， 该 功能 也 特别 有 价值 。 











1.6.5 “PostgreSQL 9.4 中 引入 的 新 特性 
9.4 版 发 布 于 2014 年 9 月， 主要 包含 以 下 新 特性 。 
物化 视图 特性 的 改进 


在 9.3 版 中 ， 刷 新 物化 视图 期 间 会 对 其 加 锁 并 禁止 访问 ， 而 加 锁 时 
间 可 能 会 比较 长 ， 这 直接 导致 在 生产 环境 中 物化 视图 的 实用 价值 严重 受 
限 。9.4 版 中 取消 了 刷新 时 的 加 锁 动 作 ， 因 此 即使 是 正在 被 刷新 的 物化 
问 。 但 请 注意 : 利用 此 特性 的 前 提 是 物化 视图 必须 拥有 一 
0 


新 增 支 持 用 于 计算 百分比 的 分 析 函 数 


新 增 了 对 percentile_disc (不 连续 百分比 ) 和 
percentile_cont (连续 百分比 ) 这 两 个 分 析 函 数 的 支持 ， 须 配合 
WITHIN GROUP (ORDER BY...) 子 句 使 用 。PostgreSQL 专家 Hubert 
Lubaczewski 在 文章 “Ordered Set Within Group Aggregates” 中 介绍 了 
ORDERED SET WITHIN GROUP 聚合 运算 。 在 9.5 之 前 的 版 本 中 ， 
PostgreSQL 并 未 提供 过 计算 中 位 数 的 函数 。 这 是 有 原因 的 。 如 果 你 对 计 
算 中 位 数 的 相关 算法 有 所 了 解 的 话 ， 应 该 知道 这 种 算法 中 最 后 都 会 有 一 
个 额外 的 类 似 于 “平局 加 时 赛 ” 的 计算 步骤 ， 这 个 步骤 的 存在 使 得 将 中 位 
数 算 法 实现 为 聚合 函数 非常 困难 。9.5 版 中 引入 的 这 两 个 分 析 函 数 使 用 
了 一 种 快速 中 位 数 估 算 算 法 ， 从 而 绕 开 了 前 述 问 题 。 我 们 将 在 7.2.16 市 
对 这 两 个 函数 进行 更 深入 的 介绍 。 























支持 对 视图 更 新 操作 的 结果 范围 进行 限制 


创建 视图 时 支持 WITH CHECK OPTION 子 句 ， 其 作用 是 确保 在 视图 
上 执行 更 新 或 者 插入 操作 时 ， 修 改 后 或 者 新 插入 的 记录 仍然 在 本 视图 可 
见 范围 内 。 详 情 请 参见 示例 7-3。 


新 增 对 JSONB 数据 类 型 的 支持 


该 数据 类 型 是 JSON (JavaScript Object Notation ) 类 型 的 二 进 制 存 
储 版 本 。 通 过 JSONB 类 型 可 以 对 JSON 格式 的 文档 数据 建立 索引 ， 并 
可 加 快 对 其 内 部 元 素 的 访问 速度 。 详 细 信息 请 参考 5.6 节 ， 同 时 可 参考 
这 两 篇 博客 文章 : “Introduce jsonb: A Structured Format for Storing 
JSON”" 以 及 “JSONB: Wildcard Query”。 


GIN 索引 改进 


GIN 索引 在 设计 时 已 经 考虑 了 要 适用 于 全 文 搜索 、 三 连词 处 
理 、hstore 键 值 数据 库 以 及 jsonb 类 型 文 持 等 场景 。 在 很 多 情况 下 你 
甚至 可 以 把 它 当 作 B- 树 索引 的 蔡 代 品 ， 一 般 来 说 GIN 索引 与 B- 树 的 查 
找 效 率 相 当 ， 但 占用 空间 更 少 。9.5 版 中 ，GIN 索引 的 查询 速度 被 进 一 
步 提 升 。 详 情 请 参见 “GIN as a Substitute for Bitmap Indexes” 这 篇 文章 的 
介绍 。 














支持 更 多 JSON 函数 

具体 包括 json build array 、json build object 
、json_object 、json_to_record 和 json_to_recordset 等 儿 个 函 
数 
加 速 跨 表 衬 间 的 对 象 搬迁 

文 持 使 用 以 下 语法 轻松 地 将 所 有 数据 库 对 象 从 一 个 表 空 间 移动 到 另 
一 个 表 空 间 : ALTER TABLESPACE old_space MOVE ALL TO 
new_space; 。 
文 持 对 返回 的 结 末 集 中 的 记录 加 上 数字 编号 


现在 可 以 为 查询 结果 中 的 记录 添加 行 号 。 行 号 用 系统 字段 
ordinality (该 字段 是 在 ANSI SQL 标准 中 定义 的 ) 表示 。 当 需要 将 








存储 为 数组 、hstore 键 值 对 或 者 复合 类 型 的 非 格式 化 数据 转换 为 格式 
化 记录 时 ， 该 功能 特别 有 用 。 以 下 是 一 个 使 用 hstore 的 例子 : 


SELECT ordinality, key, value 
FROM each('breed=>pug, cuteness=>high'::hstore) WITH ordinality; 





支持 通过 执行 SQL 命令 来 更 改 系统 配置 设置 


利用 ALTER system SET ... 语法 ， 无 须 修改 postgresql.conf 文件 
即 可 设置 全 局 系统 配置 。postgresql.conf 文件 具体 的 修改 方法 请 参见 
2.1.2 节 。 这 也 意味 着 用 户 可 以 通过 编程 的 方式 动态 地 调整 系统 配置 
项 ， 但 请 注意 : 有 的 配置 项 修改 后 需要 重启 数据 库 才 能 生效 。 


触发 器 功能 增强 
9.4 版 中 文 持 了 对 外 部 表 创 建 触 发 右 。 
数据 行 转 列 能 力 增强 


unnest 函数 用 于 实现 数据 的 行 转 列 操作 ， 即 将 一 个 模 回 的 数组 转 
换 为 纵向 的 一 个 字段 的 多 行 记 录 。 该 函数 可 接受 多 个 数组 作为 入 参 ， 每 
个 数组 转换 后 成 为 单独 的 一 列 ， 即 输入 几 个 数组 转换 后 就 有 几 列 。 如 条 
每 个 数组 的 元 系 个 数 不 一 样 ，9.4 版 之 前 转换 后 的 结果 是 不 可 预知 的 ， 
9.4 版 本 后 这 种 情况 下 转换 的 结果 是 可 预知 的 ， 会 以 最 长 的 数组 为 标 
准 ， 其 他 不 足 此 长 度 的 数组 元 系 补 null。 


新 增 ROWS FROM 语法 
该 语法 可 以 将 多 个 函数 返回 的 结果 集 逐 行 拼 接 起 来 ， 最 后 作为 一 个 


完整 的 结果 集 返 回 ， 因 此 即使 这 些 结果 集 之 间 的 元 素 个 数 不 一 致 也 没 关 
系 ， 如 下 例 所 示 : 

















SELECT * 
FROM ROWS FROM (jsonb each('{"a":"foo1l","b":"bar"}'::jsonb), 
jsonb each('{"c":"foo2"}'::jsonb)) 


x (al,al val,a2 val); 





支持 动态 启用 后 台 工 作 线 程 


当 使 用 SQL 或 PostgreSQL 函数 都 无 法 实现 所 需要 的 功能 时 ， 可 以 
使 用 C 语言 编码 实现 动态 后 台 工 作 线 程 来 达成 目标 。9.4 版 源码 的 
contrib/worker_spi 目录 下 实现 了 一 个 小 型 的 示例 ， 可 供 参 考 。 








1.7 ”数据库 驱动 程序 


任何 情况 下 ， 你 都 不 可 能 脱离 具体 的 业务 系统 而 仅仅 使 用 PostgreSQL 
数据 库 本 身 ， 那 显然 是 无 意义 的 。 为 了 实现 PostgreSQL 与 业务 系统 之 
间 的 交互 ， 惑 需要 借助 数据 库 驱 动 程序 。PostgreSQL 拥有 大 量 免 费 驱 


动 ， 





支持 各 种 编程 语言 和 开发 工具 。 此 外 ， 很 多 商业 公司 也 以 很 低廉 的 


价格 提供 了 各 有 特色 的 驱动 。 目 前 比较 流行 的 几 种 开源 驱动 如 下 。 


PHP 驱动 : PHP 语言 广泛 应 用 于 Web 开发 领域 ， 大 多 数 PHP 发 行 
包 都 自 帝 了 较 老 的 pgsql 驱动 或 者 是 较 新 的 pdo_pgsql 驱动 。 一 般 
ee 不 过 可 能 需要 修改 php.ini 来 决定 
启用 哪 一 种 。 

JDBC 驱动 : Java 开发 所 使 用 的 JDBC 驱动 一 直 是 与 最 新 版 
PostgreSQL 同步 更 新 的 ， 可 以 从 PostgreSQL 官方 站 点 下 载 。 

.NET 驱动 : .NET 框架 ( 含 微软 的 官方 版 和 和 Mono 社区 的 开源 版 ) 
可 使 用 Npgsql 驱动 。 目 前 该 驱动 文 持 微软 .NET 框架 ， 包 括 微软 
Entity Framework 开发 框架 以 及 Mono 开源 .NET 框架 。 

ODBC 驱动 : 如 果 需 要 从 微软 Access、Excel 或 者 其 他 支持 ODBC 
的 产品 连接 到 PostgreSQL， 可 从 PostgreSQL 官网 下 载 ODBC 驱 
动 ， 支 持 32 位 和 64 位 两 个 版 本 。 

LibreOffice/OpenOffice 驱动 : LibreOffice 3.5 及 之 后 的 版 本 中 自 带 
了 PostgreSQL 驱动 ， 但 3.5 之 前 的 版 本 以 及 OpenOffice 是 不 带 

的 ， 可 以 使 用 JDBC 或 者 SDBC 驱动 。 更 多 细节 请 参见 “OO Base 
and PostgreSQL” 这 篇 博文 。 

Python 驱动 : Python 可 通过 多 种 驱动 访问 PostgreSQL， 目 前 
psycopg2 是 最 流行 的 一 种 。Python 的 Django 开发 框架 对 
PostgreSQL 也 有 着 良好 的 支持 。 如 果 你 需要 一 个 关系 - 对 象 映 射 工 
有 具 〔 即 通常 所 说 的 ORM 工具 ) ， 可 以 考虑 使 用 最 广泛 的 SQL 
Alchemy 工具 ， 著 名 的 外 部 数据 源 封 装 器 开发 平台 Multicom 内 部 
就 使 用 了 它 。 

Ruby 驱动 : 对 Ruby 开发 人 员 来 说 ， 请 使 用 rubygems pg 驱动 。 
Perl 驱动 : Perl 可 以 使 用 DBI 和 DBD::Pg 驱动 。 也 可 以 使 用 由 
CPAN 网 站 提供 的 DBD::PgPP 驱动 。 

Node.js 驱动 : Node.js 是 一 个 JavaScript 框架 ， 可 用 于 构建 可 扩展 
的 网 络 应 用 。 该 平台 目前 文 持 两 种 PostgreSQL 驱动 : 一 种 是 Node 
Postgres， 该 驱动 可 以 选择 是 否 绑 定 本 地 libpq 库 ， 而 且 基 于 纯 





























JavaScript 〈 无 须 编 译 ) ; 另 一 种 是 Node-DBI。 


1.8 如 何 获 得 帮助 


在 使 用 PostgreSQL 的 过 程 中 ， 你 迟早 会 需要 寻求 帮助 ， 而 且 这 一 天 往 
往 会 比 预 期 来 得 早 。 我 们 希望 你 能 够 尽早 了 解 到 求助 的 途径 。 我 们 最 为 
推荐 的 途径 是 邮件 列表 ， 不 管 你 是 PostgreSQL 的 新 用 户 还 是 老 用 户 ， 
邮件 列表 都 能 为 你 解答 技术 问题 。 可 以 先 打开 PostgreSQL 邮件 列表 页 
面 。 如 果 你 是 新 手 ， 那 么 订阅 PGSQL-General 这 个 邮件 列表 是 最 合适 
的 。 如 果 你 认为 自己 发 现 了 PostgreSQL 的 bug， 那 么 打开 “PostgreSQL 
故障 报告 ”这 个 页 面 ， 上 面 会 告诉 你 具体 如 何 操 作 。 








1.9 ”PostgreSQL 的 主要 衍生 版 本 


PostgreSQL 使 用 了 MIT/BSD 风格 的 许可 证 ， 任 何人 都 可 以 合法 地 对 其 
修改 并 二 次 传播 ， 因 此 对 于 那些 想 创 建 自 己 数据 库 分 文 的 人 来 说 ， 
PostgreSQL 是 绝 佳 的 选择 。 在 过 去 的 很 多 年 间 ， 有 很 多 团队 创建 了 自己 
的 PostgreSQL 分 文 版 本 ， 并 且 对 社区 也 做 出 了 相应 的 回馈 ， 有 的 把 自 
己 的 修改 贡献 回 了 PostgreSQL 的 主干 代码 ， 有 的 对 社区 给 予 了 资金 支 
持 。 访 问 https://wiki.postgresql.org/wiki/PostgreSQL_derived_databases 这 
个 地 址 ， 就 可 以 看 到 PostgreSQL 数据 库 的 所 有 衍生 产品 。 


很 多 流行 的 分 文 版 本 是 商业 化 的 团 源 软件 。 比 如 目前 数据 仓库 领域 使 用 
很 广泛 的 Netezza 就 是 源 自 PostgreSQL 。 亚 马 逊 公司 的 Redshift 数据 仓 
库 事 实 上 是 PostgreSQL 的 一 个 分 支 的 分 文 。 亚 马 逊 还 有 其 他 两 个 与 原 
生 PostgreSQL 血缘 关系 较 近 的 产品 : Amazon RDS for PostgreSQL 和 
Amazon Aurora for PostgreSQL 。 这 两 个 产品 会 与 PostgreSQL 开源 版 本 
的 主干 代码 保持 同 源 ， 并 确保 与 原生 PostgreSQL 提供 完全 相同 的 SQL 
语法 ， 同 时 额外 提供 了 更 强 的 管理 功能 并 在 速度 方面 做 了 一 些 优化 。 
EnterpriseDB 公司 推出 的 PostgreSQL Advanced Plus 也 是 以 PostgreSQL 
为 基础 ， 另 外 增加 了 对 于 Oracle 语法 和 特性 的 兼容 支持 ， 以 吸引 原 
Oracle 用 户 。EnterpriseDB 公司 同 PostgreSQL 社区 提供 了 资金 和 开发 力 
量 的 支持 ， 对 此 我 们 表示 感谢 。 他 们 的 Postgres Plus Advanced Server 产 
辣 在 版 本 更 新 节奏 上 也 一 直 是 密切 跟 进 最 新 的 PostgreSQL 稳定 版 的 。 


Postgre-X2、Postgres-XL 和 GreenPlum 是 三 款 还 处 于 发 展 初期 的 
PostgreSQL 开源 衍生 产品 ， 其 中 GreenPlum 曾经 有 一 段 时 间 是 闭 源 的 。 
这 三 款 产品 的 目标 都 是 处 理 大 规模 数据 分 析 和 复制 工作 。 


PostgreSQL 之 所 以 衍生 版 本 众多 ， 部 分 原因 是 主干 版 本 对 于 一 些小 众 的 
需求 可 能 不 会 及 时 支持 ， 男 外 主干 版 本 的 发 布 节 舌 也 不 能 满足 所 有 人 的 
要 求 ， 那 么 自己 拉 出 来 一 个 分 支 版 本 提前 进行 修改 和 测试 就 是 更 好 的 选 
择 。 很 多 这 种 分 支 版 本 中 开发 出 来 的 新 特性 最 终 都 汇合 到 了 主干 ， 比 如 
2nd Quadrant 公司 支持 多 主 和 双 同 复制 特性 的 BDR 产品 分 文中 的 逻辑 
复制 功能 就 被 汇合 入 了 主干 ， 用 于 强化 PostgreSQL 原生 的 复制 功能 。 
PostgreSQL-XL 中 开发 的 一 些 并 行 化 特性 将 来 也 可 能 会 合 入 PostgreSQL 
主干 中 。 

















Citus 是 一 个 支持 实时 大 数据 处 理 和 并 行 查 询 功 能 的 PostgreSQL 分 文 ， 
从 PostgreSQL 9.5 开始 它 被 改造 成 了 PostgreSQL 的 一 个 扩展 包 ， 使 用 
起 来 更 加 方便 。 


Google 最 近 发 布 了 它 的 Google Cloud SQL for PostgreSQL 产品 ， 目 前 还 
处 在 beta 测试 阶段 。 


第 2 章 数据库 官 理 


本 章 涵盖 了 管理 PostgreSQL 服务 器 需要 了 解 的 一 些 基本 操作 ， 包 括 角 

色 与 权限 管理 、database 的 创建 、 安 装 扩展 包 、 数 据 备 份 与 恢复 等 。 在 
开始 之 前 ， 请 先 安装 好 PostgreSQL 及 其 相应 的 管理 工具 ， 并 且 要 保证 

自己 有 权 任 意 地 调整 和 使 用 该 套 环境 。 








2.1 配置 文件 


PostgreSQL 服务 实例 的 基本 行为 ， 主 要 包含 以 下 
三 个 文件 。 


postgresql.conf 


该 文件 包含 一 些 通用 设置 ， 比 如 内 存 分 配 、 新 建 database 的 默认 存 
储 位 置 、PostgreSQL 服务 器 的 IP 地 址 、 日 志 的 位 置 以 及 许多 其 他 设 
置 。 


pg_hba.conf 


该 文件 用 于 控制 PostgreSQL 服务 器 的 访问 权限 ， 有 具体 包括 : 允许 
哪些 用 户 连 接 到 哪个 数据 库 ， 人 允许 哪些 IP 地 址 连接 到 本 服务 器 ， 以 及 
指定 连接 时 使 用 的 吴 份 验 证 模式 。 


pg_ident.conf 


如 果 该 文件 存在 ， 则 系统 会 基于 文件 内 容 将 当前 登录 的 操作 系统 用 
户 映 冉 为 一 个 PostgreSQL 数据 库 内 部 用 户 的 映 份 来 登录 。 有 些 人 会 把 
操作 系统 的 root 用 户 映 射 为 PostgreSQL 的 postgres 超级 用 户 账号 。 





和 在 PostgreSQL 的 官方 术语 体系 中 , “角色 ”(role) 就 表示 “用 
户 ”(user) ， 但 并 不 是 所 有 的 角色 都 需要 具备 登录 权限 ， 比 如 组 角 
色 〈group role) 通常 就 不 需要 。 为 了 便于 理解 ， 本 书 中 我 们 还 是 使 
用 “用 户 ” 一 词 ， 它 的 售 义 就 是 具备 登录 权限 的 角色 。 


如 果 你 在 安装 过 程 中 使 用 了 默认 配置 ， 则 上 述 文 件 会 位 于 PostgreSQL 
主 数据 文件 夹 中 。 你 可 以 使 用 任何 文本 编辑 器 来 编辑 这 些 文 件 ， 或 者 在 
pgAdmin 的 Admin Pack 页 面 上 修改 ， 详 情 请 参见 4.2.3 节 。 如 果 你 不 确 
定 这 些 文件 的 具体 位 置 ， 以 超级 用 户 身 份 连接 到 任何 一 个 数据 库 上 并 执 
行 示例 2-1 中 的 查询 语句 即 可 找到 。 


示例 2-1 配置 文件 的 位 置 











SELECT name, setting FROM pg_settings WHERE category = "File Locations'; 


Setting 


config file /etc/postgresql/9.6/main/postgresql.conf 
data_directory /var/lib/postgresql/9.6/main 
external pid file | /var/run/postgresql/9.6-main.pid 
hba_file /etc/postgresql/9.6/main/pg_hba.conf 
ident file /etc/postgresql/9.6/main/pg_ident.conf 
(5 rows) 





2.1.1 让 配置 文件 生效 


有 些 配 置 项 修改 后 需要 重启 PostgreSQL 服务 实例 才能 生效 ， 重 启 时 会 
关闭 所 有 客户 端 连接 。 有 的 配置 项 只 需 重 新 加 载 一 下 配置 文件 即 可 生 
效 ， 此 后 连接 上 来 的 新 用 户 都 会 自动 读 取 到 新 的 配置 。 重 新 加 载 配 置 文 
件 时 ， 原 来 已 连接 的 用 户 会 话 不 会 受到 影响 。 如 果 你 不 确定 修改 了 某 个 
配置 后 是 全 需要 重 局 ， 请 查看 下 该 配置 项 的 context 属性 ， 如 果 是 
postmaster ， 那 么 需要 重启 ; 如 果 是 user ， 那 么 重新 加 载 配置 文件 
即 可 。 


01. 重新 加 载 配置 文件 


有 大 二 种 万 法 可 以 重新 加 载 配 置 文件 ， 其 中 一 种 是 打开 控制 台 窗 口 
并 执行 以 下 命令 : 


pg_ctl reload -D 你 的 数据 目录 


如 果 你 在 RedHat Enterprise Linux、CentOS 或 者 是 Ubuntu 中 以 服 
务 的 形式 安装 了 PostgreSQL， 那 么 执行 以 下 命令 即 可 : 














service postgresql-9.5 reload 


命令 中 的 postgresql-9.5 是 你 的 服务 名 。 (有 的 老 版 本 的 


I 


02. 


PostgreSQL 的 服务 名 就 是 postgresql ， 不 带 版 本 号 。) 


还 有 一 种 加 载 配置 文件 的 方法 是 以 超级 用 户 身 份 登录 到 任何 数据 库 
并 执行 以 下 SQL: 


SELECT pg_reload conf(); 


最 后 还 有 一 种 方法 是 用 pgAdmin 工具 实现 重 加 载 ， 详 情 参 见 4.2.3 
节 


重启 PostgreSQL 运 行 实例 


一 些 底层 的 配置 修改 后 必须 重启 PostgreSQL 服务 实例 才能 生效 。 
可 以 通过 先 停止 再 启动 PostgreSQL 后 台 服 务 的 方法 来 完成 此 过 
程 。 将 服务 器 直接 断 电 重启 当然 也 可 以 《开玩笑 ， 尽 量 别 这 人 么 
Ts 


PostgreSQL 运行 实例 无 法 通过 执行 PostgreSQL 本 身 的 命令 行 来 实 


现 重 局， 只 能 通过 操作 系统 的 命令 来 实现 。 在 Linux/Unix 系统 上 ， 
如 果 PostgreSQL 实例 是 以 服务 形式 运行 的 ， 请 执行 : 


service postgresql-9.6 restart 


如 果 不 是 以 服务 形式 运行 的 ， 请 执行 : 








pg_ctl restart -D 你 的 数据 目录 


在 Windows 上 ， 请 打开 服务 管理 器 ， 找 到 PostgreSQL 服务 ， 然 后 
对 它 点 击 重启 即 可 。 





2.1.2 postgresql.conf 


postgresql.conf 文件 包含 了 PostgreSQL 服务 正常 运行 所 必需 的 基础 设 


置 。 你 可 以 在 数据 库 级 、 用 户 级 、 会 话 级 甚至 是 函数 级 重 载 这 些 设 
置 。“Tuning Your PostgreSQL Server 这 篇 文章 详细 介绍 了 如 何 通过 修改 
设置 来 优化 你 的 PostgreSQL 系统 。 


PostgreSQL 9.4 引入 了 一 个 重要 的 变更 : 该 版 本 引入 了 一 个 新 的 名 为 
postgresql.auto.conf 的 配置 文件 ， 其 中 的 配置 项 会 覆盖 postgresql.conf 的 
同名 配置 项 。 建 议 你 不 要 直接 修改 postgresql.conf， 而 是 优先 修改 


postgresdql.auto.conf 。 
01. 查看 postgresql.conf 中 的 配置 


通过 但 询 pg_settings 视图 即 可 碍 看 所 有 配置 项 内 容 ， 无 须 打 开 
配置 文件 。 示 例 2-2 展示 了 具体 的 查询 语法 。 


示例 2-2 关键 的 设置 








SELECT 
name, 
context ©, 
unit @, 
setting, boot val, reset val © 
FROM pg settings 
WHERE name IN ( 'listen addresses','deadlock timeout','shared buffers' 
"effective cache size','work mem','maintenance work_ mem') 
ORDER BY context, name; 


setting 


listen addresses postmaster 

shared buffers postmaster 131584 
deadlock timeout superuser 1666 
effective _ cache size user 16384 
maintenance work mem user 16384 
work_mem user 5120 





@ context 字段 代表 配置 项 的 作用 范围 。 各 配置 项 的 作用 范围 大 
小 不 一 ， 有 具体 取决 于 context 字段 的 内 容 。 


context 值 为 user 表示 是 用 户 级 配置 项 ， 它 可 以 被 每 个 用 户 单独 
修改 ， 也 就 是 说 访 配 置 项 针对 每 个 用 户 都 可 以 有 不 同 的 值 ， 用 户 修 


改 后 会 在 自己 的 所 有 会 话 中 生效 。 如 果 是 超级 用 户 修改 了 一 个 
user 级 的 配置 项 ， 那 么 所 有 此 后 连接 上 来 的 用 户 都 会 将 这 个 修改 
过 的 值 作 为 默认 值 。 


context 值 为 superuser 表示 是 超级 用 户 级 配置 项 ， 只 能 由 超级 
用 户 来 修改 ， 修 改 并 且 重 新 加 载 后 会 在 所 有 用 户 会 话 中 生效 。 非 超 
级 用 户 不 能 在 自己 的 会 话 中 修改 履 盖 这 个 值 。 


context 值 为 postmaster 表示 是 整个 服务 实例 级 配置 项 
(postmaster 就 代表 了 PostgreSQL 服务 实例 ) ， 更 改 后 需要 重启 
PostgreSQL 服务 才能 生效 。 


context 为 user 和 superuser 的 配置 项 可 以 在 database 级 、 用 户 
级 、 会 话 级 和 函数 级 分 别 设置 。 比 如 对 于 一 个 能 写 出 非常 烧 脑 的 
SQL 的 专家 用 户 来 说 ，work_menm 参数 应 该 设置 得 大 一 些 。 又 比 
如 ， 如 果 有 一 个 函数 里 面 会 进行 密集 的 排序 操作 ， 那 么 可 以 仅 针对 
此 函数 调 大 work_menm 的 值 。database 级 、 用 户 级 、 会 话 级 和 函数 
级 的 参数 设置 不 需要 执行 重 加 载 操作 。 数 据 库 级 的 参数 设置 会 在 用 
Ce 会 话 和 函数 级 的 参数 设置 立即 生 

XX o 


@ 请 注意 内 存 相 关 参 数 所 使 用 的 单位 。 在 示例 2-2 的 输出 结果 中 ， 
内 存 相关 参数 有 些 以 8KB 为 单位 ， 有 些 以 KB 为 单位 。 不 管 最 终 
显示 时 用 的 是 什么 单位 ， 设 置 时 都 可 以 用 任何 你 觉得 方便 的 单位 。 
对 于 大 多 数 内 存 相 关 配 置 项 来 襄 ，128MB 是 一 个 比较 合适 的 值 。 
我 们 认为 以 8KB 为 单位 来 显示 内 存 配置 是 一 种 很 糟糕 的 做 法 ， 看 
起 来 很 不 直观 ， 也 容易 改 错 。 可 以 用 SHOW 命令 来 查看 配置 项 ， 它 
的 输出 结果 会 自动 根据 数值 大 小 选择 合适 的 单位 来 呈现 ， 比 较 直 
观 。 例 如 : 执行 SHOW shared_buffers; 显示 的 结果 是 1928MB 
《而 非 前 面 查 出 来 的 131 584 个 8KB) 。 类 似 地 ， 运 行 SHOW 
deadlock timeout; 返回 的 是 1s (而 非 前 面 查 出 来 的 1000 
ms) 。 如 果 你 想 以 合适 的 单位 查看 所 有 参数 ， 请 执行 SHOW ALL 。 


@ setting 是 指 当 前 设置 ，boot_val 是 指 默认 设置 reset _val 
是 指 重 新 启动 服务 器 或 重新 加 载 设置 之 后 的 新 设置 。 修 改 了 设置 

后 ， 一 定 要 记得 查看 一 下 setting 和 reset_val 并 确保 二 者 是 一 
致 的 ， 否 则 说 明 设置 并 未 生效 ， 需 要 重新 局 动 服务 器 或 者 重新 加 载 


设置 。 


























9.5 版 中 引入 了 一 个 新 的 pg_file_settings 视图 ， 通 过 该 视图 也 
可 以 进行 配置 信息 查询 。 碍 询 该 视图 会 列 出 每 个 配置 项 所 属 的 配置 
文件 。 其 中 applied 字段 表示 该 配置 项 是 否 已 经 生效 ， 如 果 值 为 二 
， 表 示 需 要 重启 服务 器 或 者 重 加 载 配置 文件 。 如 果 postgresql.conf 
和 postgresql.auto.conf 中 存在 同名 配置 ， 那么 后 者 会 履 盖 前 者 ， 上 月 
本 生 pg_file_settings 中 对 应 的 条 目 会 显示 applied 字段 为 二 
具体 如 示例 2-3 所 示 。 


示例 2-3 ”查询 pg_file settings 视图 

















SELECT name, sourcefile, sourceline, setting, applied 

FROM pg file settings 

WHERE name IN ('listen addresses','deadlock timeout','shared buffers', 
'effective cache size','work mem','maintenance work_ mem') 

ORDER BY name; 


sourcefile | sourceline | se 


effective cache size :/data96/postgresql.auto.conf| 11 
listen addresses :/data96/postgresql.conf | 59 
maintenance work mem :/data96/postgresql.auto.conf| 3 
shared buffers :/data96/postgresql.conf | 115 
shared buffers :/data96/postgresql.auto.conf| 5 





请 特别 注意 postgresql.conf 或 者 postgresql.auto.conf 中 的 以 下 网 络 
设置 ， 如 果 设 得 不 对 会 导致 客户 端 无 法 连接 ， 修 改 这 些 值 是 一 定 要 
重新 启动 数 据 库 服务 的 。 


listen addresses 


表示 PostgreSQL 服务 使 用 的 IP 地 址 ， 一 般 会 设置 为 
localhost ， 表 示 本 机 的 IPV6 或 者 IPV4 地 址 。 但 也 有 很 多 人 会 
设置 为 * ， 表 示 使 用 任意 本 机 IP 地 址 均 可 连接 到 PostgreSQL 服 
务 。 


port 


PostgreSQL 服务 的 侦 听 端口 ， 默 认 值 为 5432。 这 个 端口 广 为 
人 知 ， 因 此 建议 修改 为 别 的 端口 ， 这 样 可 以 降低 受 攻击 的 概率 。 妆 


然 ， 如 果 你 在 同一 台 机 器 上 局 动 了 多 个 PostgreSQL 服务 实例 ， 那 
么 每 个 服务 实例 的 侦 听 端口 都 不 能 重复 ， 此 时 也 需要 修改 该 配置 。 


max_connections 
系统 允许 的 最 大 并 发 连接 数 。 
log destination 


这 个 配置 项 的 名 字 可 能 有 点 误导 ， 它 实际 指 的 是 日 志文 件 的 输 
出 格式 而 非 输出 的 物理 位 置 。 默 认 值 是 stderr 。 如 果 你 希望 保存 
日 志 内 容 以 做 进一步 分 机， 建议 把 它 修改 为 csvlog ， 这 样 就 更 容 
易 将 日 志 导 入 第 三 方 日 志 分 析 工 具 中 使 用 。 注 意 ， 如 果 和 希望 记 日 志 
的 话 ， 请 一 定 要 将 logging_collection 配置 项 设 为 on 。 


下 面 介绍 的 几 个 配置 项 会 影响 整体 系统 性 能 ， 其 默认 值 一 般 都 不 是 
的 。 建 议 用 户 对 它们 有 所 了 解 后 尽快 根据 实际 情况 做 优化 调 











shared buffers 


此 设置 定义 了 用 于 绥 存 最 近 访 问 过 的 数据 页 的 内 存 区 大 小 ， 所 
有 用 户 会 话 均 可 共享 此 绥 存 区 。 此 设置 对 查询 速度 有 着 重大 影响 ， 
般 来 说 设置 得 越 大 越 好 ， 至 少 应 该 达到 系统 总 内 存 的 25%， 但 不 
宜 超过 8GB， 因 为 超过 后 会 出 现 “ 边 际 收益 递减 ?效应 ， 即 消耗 的 内 
存 很 多 ， 但 得 到 的 速度 提升 却 很 少 ， 得 不 偿 失 。 修 改 此 设置 需要 重 
启 PostgreSQL 服务 。 

















effective _ cache size 


该 配置 项 是 一 个 估算 值 ， 表 示 操 作 系 统 分 配 多 少 内 存 给 
PostgreSQL 专用 。 系 统 并 不 会 根据 这 个 值 来 真实 地 分 配 这 么 多 内 
存 ， 但 是 规划 器 会 根据 这 个 值 来 判断 系统 能 否 提 供 查 询 执 行 过 程 中 
所 需 的 内 存 。 如 果 将 此 设置 设 得 过 小 ， 远 远 小 于 系统 的 真实 可 用 内 
存量 ， 那 么 可 能 会 给 规划 器 造成 误导 ， 让 规划 器 认为 系统 可 用 内 存 
有 限 ， 从 而 选择 不 使 用 索引 而 是 执行 全 表 扫 描 《〈 因 为 使 用 索引 虽然 
速度 快 ， 但 需要 占用 更 多 的 中 间 内 存 ) 。 在 一 台 专 用 于 运行 
PostgreSQL 数据 库 服务 的 服务 器 上 ， 建 议 将 





effective_cache_size 的 值 设 为 系统 总 内 存 的 一 半 或 者 更 多 。 
此 设置 的 更 改 可 动态 生效 ， 执 行 重新 加 载 即 可 。 


work_mem 


此 设置 指定 了 用 于 执行 排序 、 散 列 关 联 、 表 扫 措 等 操作 的 最 大 
内 存 大 小 。 要 得 到 此 设置 的 最 优 值 需要 考虑 以 下 因素 : 数据 库 的 使 
用 方式 ， 需 要 预 留 多 少 内 存 给 除数 据 库 系统 外 的 程序 ， 以 及 服务 器 
是 否 专用 于 运行 PostgreSQL 服务 等 问题 。 如 果 使 用 场景 仅仅 是 有 
很 多 用 户 并 发 执行 简单 查询 ， 那 么 这 个 值 可 以 设 得 小 一 点 ， 这 样 每 
个 用 户 都 得 以 较为 公平 地 使 用 内 存 ， 和 否则 第 一 个 用 户 就 可 能 把 内 存 
占 光 。 这 个 值 该 设 多 大 同样 取决 于 你 的 机 器 上 总 共有 多 少 内 存 可 
用 。 关 于 work_mem 设置 有 一 篇 很 好 的 文章 “Understanding 
work_mem”。 此 设置 的 更 改 可 动态 生效 ， 执 行 重新 加 载 即 可 。 





maintenance work_mem 


此 设置 指定 了 可 用 于 vaccum 〈 即 清空 已 标记 为 “被 删除 ”状态 
的 记录 ) 这 类 系统 内 部 维护 操作 的 内 存 总 量 。 其 值 不 应 大 于 1GB。 
此 设置 的 更 改 可 动态 生效 ， 执 行 重新 加 载 即 可 。 


max_parallel_workers_per_gather 


这 是 9.6 版 中 新 引入 的 一 个 配置 项 ， 用 于 控制 语句 执行 的 并 行 
度 。 该 配置 项 决定 了 执行 计划 的 每 个 gather 节点 中 最 多 允许 启动 多 
少 个 worker 进程 并 行 工 作 。 默 认 值 为 0， 表 示 不 启用 并 行 功能 。 如 
果 你 的 PostgreSQL 服务 器 是 多 核 的 ， 那 么 建议 评估 后 尝试 开启 此 
参数 。 并 行 处 理 是 9.6 版 开始 文 持 的 新 特性 ， 因 此 你 需要 做 一 些 测 
试 来 验证 到 底 将 并 行 度 设 为 多 大 时 效果 最 好 。 另 外 ， 注 意 该 配置 项 
的 值 应 该 小 于 max_worker_processes 的 值 (默认 为 8) ， 因 为 
用 于 并 行 处 理 的 后 人 台 worker 进程 是 系统 总 体 后 台 worker 进程 的 一 


部 分 。 


版 本 10 中 引入 了 一 个 新 的 参数 叫 作 max_parallel_workers 
， 用 于 控制 所 有 后 台 worker 进程 中 有 多 少 可 用 于 并 行 。 


02. 修改 postgresql.conf 中 配置 项 的 值 








03. 


PostgreSQL 9.4 中 引入 了 对 新 的 ALTER SYSTEM SQL 命令 的 支持 ， 
使 用 该 命令 可 以 更 改 设置 。 例 如 ， 如 果 要 设置 一 个 全 局 生效 的 
work_mem ， 执 行 以 下 命令 即 可 : 


ALTER SYSTEM SET work mem = '5006MB'; 


该 命令 不 会 直接 修改 postgresql.conf 文件 本 身 ， 而 是 会 去 修改 
postgresql.auto.conf 文件 。 


每 个 设置 有 着 各 目 不 同 的 特性 ， 有 的 更 改 后 必须 重启 数据 库 服 务 才 
能 生效 ， 有 的 只 要 重新 加 载 一 次 就 可 以 了 ， 下 面 这 个 命令 可 以 实现 
设置 重新 加 载 : 


SELECT pg_reload conf(); 


如 果 你 需要 时 常 修改 很 多 配置 项 ， 那 么 可 以 尝试 将 它们 分 门 别 类 存 
放 到 多 个 配置 文件 中 ， 然 后 通过 在 postgresql.conf 中 使 用 include 
或 者 include_if_exists 前 级 来 引入 这 些 配 置 文 件 。 具 体 语法 如 











include ' 配 置 文 件 名 ' 





这 里 的 配置 文件 名 可 以 是 绝对 路 径 也 可 以 是 相对 路 径 ， 相 对 路 径 的 
起 始 位 置 就 是 postgresql.conf 文件 本 身 所 在 的 位 置 。 


“我 修改 了 postgresql.conf 文 件 ， 结 条 数 据 库 服务 无 法 局 动 了 ， 该 
怎么 办 ? » 


定位 这 种 问题 最 简单 的 方法 是 查看 日 志文 件 ， 该 文件 位 于 
PostgreSQL 数据 文件 夹 的 根 目 录 或 者 pg_log 子 文 件 夹 下 。 只 要 找 
到 最 近 修 改 的 那个 日 志文 件 并 查看 其 最 后 一 行 的 内 容 ， 束 能 找到 本 
次 问题 的 相关 错误 日 志 。 日 志 的 内 容 一 般 都 是 比较 直 白 易 懂 的 ， 你 
看 了 就 会 明白 。 














最 常见 的 错误 是 把 shared_buffers 设 得 太 大 了 。 还 有 一 个 常见 问 
题 是 由 于 上 次 系统 异常 关闭 导致 遗留 了 一 个 没 来 得 及 删除 的 
postmaster.pid 文件 ， 访 文件 就 位 于 数据 文件 夹 下 ， 你 可 以 手动 删除 
该 文件 并 重新 启动 PostgreSQL 。 


2.1.3 pg_hba.conf 


pg_hba.conf 文件 指定 了 哪些 IP 地 址 和 哪些 用 户 可 以 连接 到 
PostgreSQL 数据 库 ， 同 时 还 规定 了 用 户 必 须 使 用 何 种 里 份 验 证 方式 
登录 。 针 对 该 文件 的 修改 可 动态 生效 ， 执 行 一 次 配置 重 加 载 即 可 。 
一 个 典型 的 pg_hba.conf 文件 看 起 来 如 示例 2-4 所 示 。 


示例 2-4 ”pg_hba.conf 文件 示例 





# TYPE  _ DATABASE USER ADDRESS METHOD 
host all all 127.6.6.1/32 ident © 
host all all ::1/128 trust @ 
host all all 192.168.54.6/24 md5 © 
hostssl all all 0.0.0.6/6 md5 @ 


# TYPE DATABASE USER ADDRESS METHOD 
# Allow replication connections from localhost, 
# by a user with replication privilege. © 
#host replication postgres 127.6.6.1/32 trust 
#host replication postgres ::1/128 trust 





@ 身份 验证 模式 。 一 般 有 以 下 几 种 常用 选项 : ident 、trust 
、md5 、peer 以 及 password 。 


四 用 于 定义 IPv6 网 段 。 只 有 服务 器 支持 IPv6 时 才 可 以 配置 该 项 ， 

如 果 在 非 IPv6 网 络 环境 下 配置 了 这 样 的 条 目 ， 会 导致 pg_hba.conf 
文件 无 法 加 载 ， 从 而 进一步 导致 任何 客户 端 都 无 法 连接 。 

全 用 于 定义 IPv4 网 段 。 第 一 部 分 是 网 络 地 址 ， 后 面 跟着 的 是 子 网 
掩 码 ， 比 如 192.168.54.0/24。 这 样 定义 的 效果 是 该 子 网 中 的 任何 客 
户 端 都 可 以 连 到 本 PostgreSQL 实例 。 


@@ 这 是 针对 SSL 连接 的 规则 。 本 例 中 ， 任 何 能 使 用 SSL 方式 连接 


的 客户 端 都 可 以 连接 到 本 PostgreSQL 实例 。 


SSL 相关 配置 都 在 postgresql.conf 和 postgresql.auto.conf 中 ， 包 含 
以 下 几 项 : ss1 、ss1_cert file 、ss1_ key file 。 一 旦 确认 客 
户 端 支持 SSL，PostgreSQL 服务 端 就 会 接受 其 连接 请 求 ， 并 且 该 连 
接 上 所 有 传输 的 内 容 都 会 使 用 ssl key 加 密 。 


加 这 是 允许 与 本 节点 构成 复制 关系 的 其 他 PostgreSQL 服务 器 节点 
的 I 了 P 网 段 。 


对 于 每 一 个 连接 请 求 ，postgres 服务 会 按照 pg_hba.conf 文件 中 记 
录 的 规则 条 目 自 上 而 下 进行 检查 。 当 匹配 到 第 一 条 允许 此 请 求 接 入 
的 规则 时 ， 就 不 再 往 下 检查 ， 系 统 将 允许 该 连接 请 求 。 类 似 地 ， 如 
果 匹 配 到 一 条 拒绝 此 连接 请 求 的 规则 ， 也 不 再 继续 检查 ， 并 拒绝 该 
连接 请 求 。 如 果 一 直 搜索 到 文件 的 末尾 都 没 能 找到 匹配 项 ， 那 么 该 
连接 请 求 会 被 拒绝 。 大 家 第 犯 的 一 个 错误 是 把 规则 的 顺序 放 错 。 例 
如 ， 如 果 你 将 +6.6.6.6/6 reject+ 规则 放 到 +127.6.6.1/32 
trust 的 前 面 ， 那 么 此 时 本 地 用 户 全 都 无 法 连接 ， 即 使 下 面 有 规则 
允许 也 不 行 。 


PostgreSQL 10 中 引入 了 一 个 新 的 名 为 pg_hba_file_rules 的 视 
图 ， 通 过 查询 该 视 图 可 以 直接 看 到 pg_hba.conf 中 的 内 容 。 


a. “我 修改 了 pg_hba.conf 文 件 ， 结 果 服 务 器 朋 江 了， 该 怎么 
办 ? 39 
































不 用 担心 ， 这 种 事情 经 常 发 生 ， 解 决 起 来 不 难 。 这 一 般 是 因 拼 
写 错误 或 增加 了 一 种 不 支持 的 身份 验证 模式 导致 的 。 如 果 
postgres 服务 无 法 正确 地 解析 pg_hba.conf 文件 ， 那 么 为 确保 
系统 安全 ， 它 会 禁止 所 有 的 连接 请 求 甚至 是 禁止 系统 启动 。 最 
简单 的 诊断 方法 是 看 一 下 日 志 ， 文 件 就 在 数据 文件 夹 的 根 目录 
下 或 者 其 pg_ log 子 文件 夹 下 。 可 以 打开 修改 日 期 最 近 的 日 志 
文件 并 看 一 下 最 后 一 行 的 内 容 ， 错 误 提 示 信 息 一 般 就 在 那里 ， 
而 且 一 般 都 是 很 好 理解 的 。 如 果 你 经 常会 笔 误 ， 改 错 东 西 ， 那 
么 请 一 定 记得 在 修改 配置 文件 之 前 做 个 备份 。 


b. 号 份 验证 方法 

















PostgreSQL 提供 了 多 种 模式 用 于 用 户 映 份 验 证 ， 很 可 能 是 所 有 
数据 库 里 面 文 持 的 模式 最 多 的 。 大 多 数 人 只 会 用 到 其 中 几 种 最 
常见 的 : trust 、peer 、ident 、md5 和 password 。 还 有 
一 种 reject 模式 ， 其 作用 是 拒绝 所 有 请 求 。 不 过 别 瑟 了 
pg_hba.conf 中 还 可 以 定义 其 他 不 同 层 面 的 身份 验证 模式 《〈 比 
如 gss、sspi 、1ldap 、radius 、cert 、pam 等 ) ， 它 就 好 
像 是 整个 PostgreSQL 服务 器 的 看 门人 ， 确 保 整 个 系统 的 外 部 
访问 安全 。 当 然 ， 在 通过 了 这 一 层 外 部 安全 控制 并 成 功 建立 连 
接 以 后 ， 连 上 来 的 用 户 仍 需 遵 守 角 色 权 限 和 数据 库 访问 限制 等 
内 部 约束 规则 。 


最 常用 的 身份 验证 方法 有 以 下 这 些 。 





trust 


这 是 最 不 安全 的 身份 验证 模式 ， 用 户 无 须 提供 密码 就 可 以 
连接 到 数据 库 。 只 要 源 端 卫 地 址 、 连 接 用 户 名 、 要 访问 的 
database 名 都 与 该 条 规则 匹配 ， 用 户 束 可 以 连 上 来 。trust 模 
式 很 不 安全 ， 因 此 应 对 其 使 用 予以 限制 ， 即 只 能 允许 从 数据 库 
服务 器 本 机 发 起 的 连接 或 者 是 同属 内 网 的 用 户 发 起 的 连接 使 用 
此 模式 。 但 即使 加 了 前 述 限 制 也 不 能 保证 安全 ， 因 为 会 有 人 通 
过 伪装 IP 地 址 的 方式 来 冒 用 此 权限 ， 所 以 有 些 安 全 意识 比较 
强 的 人 认为 该 模式 应 该 被 彻底 禁用 。 人 然而 在 单 用 户 的 介面 环境 
下 ， 这 却 是 最 和 常用 的 身份 验证 模式 ， 因 为 一 般 这 种 场景 下 系统 
的 安全 性 根本 不 是 问题 。 


md5 
该 模式 很 党 用， 要求 连接 发 起 者 携带 用 md5 算法 加 密 的 





password 
该 模式 要 求 连接 发 起 者 携 市 明文 密码 进行 导 份 验证 。 
ident 


该 喘 份 验 证 模式 下 ， 系 统 会 将 请 求 肥 起 者 的 操作 系统 用 户 





映射 为 PostgreSQL 数据 库 内 部 用 户 ， 并 以 该 内 部 用 户 的 权限 
登录 ， 且 此 时 无 须 提 供 登 录 密 码 。Windows 上 不 支持 ident 
验证 方式 。 


peer 


该 模式 下 系统 会 直接 从 操作 系统 内 核 获取 当前 连接 发 起 者 
的 操作 系统 用 户 名 ， 如 果 与 其 请 求 连接 的 PostgreSQL 用 户 名 
一 致 ， 即 可 连接 成 功 。 该 模式 仅 可 用 于 Linux、BSD、Mac OS 
X 和 Solaris， 并 且 仅 可 用 于 本 地 服务 器 发 起 的 连接 。 





cert 


该 模式 要 求 客户 端 必须 使 用 SSL 方式 进行 连接 。 连 接 发 
起 者 必须 提供 一 个 合法 的 SSL 证 书 。 该 模式 使 用 一 个 身份 认 
证 文件 (比如 pg_ident) 来 将 SSL 证 书 映射 为 PostgreSQL 数 
据 库 的 内 部 用 户 ， 该 模式 在 所 有 文 持 SSL 连接 的 平台 上 都 可 
用 


另外 还 有 一 些 不 常见 的 验证 方式 ， 比 如 gss 、radius 、1dap 
和 pam 。 有 的 可 能 不 会 默认 安装 。 


多 种 身份 验证 模式 是 可 以 同时 使 用 的 ， 即 使 是 针对 同一 个 
database 也 可 以 这 么 做 ， 也 瓯 是 说 我 们 可 以 针对 同一 个 
database 设置 多 条 里 份 验证 规则 ， 并 且 每 条 规则 的 喘 份 验 证 模 
式 都 不 一 样 。 但 请 你 务必 牢记 PostgreSQL 对 于 pg_hba.conf 中 
的 规则 的 查找 顺序 是 从 上 到 下 ， 第 一 条 匹配 到 的 规则 就 是 系统 
使 用 的 规则 。 





01. 2.2 ”连接 管理 


我 们 可 能 时 不 时 地 会 遇 到 一 些 想 要 终止 数据 库 连 接 的 情况 ， 比 如 有 
人 执行 了 写 得 很 糟糕 的 SQL 语句 把 系统 资源 耗 光 ， 当 然 这 肯定 不 
征 他 的 本 意 ， 又 比如 你 在 执行 霖 些 语句 时 发 现 其 耗 时 太 长 ， 超 出 了 
目 己 的 忍耐 极限 。 发 生 这 些 情况 时 ， 我 们 一 般 都 会 希望 结束 这 些 操 
作 或 者 干脆 彻底 终止 这 个 连接 。 


强行 中 断 语 句 执 行 或 者 终止 连接 是 一 种 很 不 “优雅 的 行为 ， 应 当 尽 
量 避 免 。 在 客户 端 应 用 程序 中 ， 首 对应 该 采取 措施 防止 或 者 想 办 法 
解决 SQL 语句 出 现 失 控 〈( 耗 时 长 或 者 占 资源 多 ) 的 情况 ， 然 后 再 
考虑 通过 在 后 台 和 直接 杀 掉 的 方式 处 理 。 出 于 礼貌 ， 你 应 该 在 终止 连 
接 之 前 通知 相关 用 户 其 连接 即将 被 强行 终止 ， 或 者 如 果实 在 有 必 

要 ， 你 也 可 以 不 管 它 什么 礼貌 不 礼貌 ， 等 四 下 无 人 时 直接 终止 这 些 
连接 束 好 了 。 


有 的 场景 下 我 们 会 需要 杀 掉 所 有 正在 运行 的 更 新 操作 ， 比 如 备份 数 
据 库 之 前 以 及 恢复 数据 库 之 前 。 


要 想 终 止 正 在 执行 的 语句 并 杀 邱 连接 ， 请 使 用 以 下 步骤 。 
(1) 碍 出 活动 连接 列表 及 其 进程 ID。 


SELECT * FROM pg stat_activity 


pg_stat_activity 视图 包含 每 个 连接 上 最 近 一 次 执行 的 语句 、 使 
用 的 用 户 名 (usename 字段 ) 、 所 在 的 database 名 (datname 字 
段 ) 以 及 语句 开始 执行 的 时 间 。 通 过 查询 该 视图 可 以 找到 需要 终止 
的 会 话 所 对 应 的 进程 ID。 


(2) 取消 连接 (假设 对 应 的 进程 号 是 1234) 上 的 活动 得 询 。 


SELECT pg _cancel backend(1234); 




















该 操作 不 会 终止 连接 本 身 。 
(3) 终止 该 连接 。 


SELECT pg _ terminate backend(1234); 


有 时 候 你 会 需要 终止 这 个 连接 ， 特 别 是 执行 数据 库 恢 复 之 前 。 如 果 
仅仅 是 终止 了 正在 执行 的 语句 而 没有 彻底 杀 掉 连接 ， 客 户 端 是 可 以 
立即 重新 执行 刚刚 被 终止 掉 的 语句 的 ， 这 又 会 导致 系统 陷入 之 前 的 
状态 。 为 了 避免 此 种 情况 的 发 生 ， 可 以 采用 直接 终止 连接 的 方式 。 

如 果 你 未 停止 某 个 连接 上 正在 执行 的 语句 就 直接 终止 该 连接 ， 那 么 
这 些 语句 也 会 被 停止 掉 。 


PostgreSQL 支持 在 SELECT 查询 语句 中 调用 函数 。 因 此 ， 尽 管 
pg_terminate_backend 和 pg_cancel_backend 一 次 仅 能 处 理 一 
个 连接 ， 但 你 可 以 通过 在 SELECT 语句 中 调用 函数 的 方式 实现 一 次 
处 理 多 个 连接 。 例 如 ， 如 果 你 希望 一 次 性 终止 某 个 用 户 的 所 有 连 
接 ， 那 么 可 以 执行 以 下 语句 。 





SELECT pg _ terminate backend(pid) FROM pg stat activity 
WHERE Usename = 'some role'; 





PostgreSQL 有 一 些 语句 参数 可 以 用 来 控制 语句 的 运行 状态 ， 一 旦 语 
句 运行 期 间 的 某 些 状态 值 超过 了 这 些 运行 参数 所 限定 的 范围 ， 该 后 
句 会 被 系统 自动 杀 挥 。 这 些 参数 可 以 在 服务 实例 级 、database 级 、 
用 户 级 、 会 话 级 和 函数 级 设置 。 参 数值 设 为 0 代表 禁用 。 





deadlock timeout 


该 参数 表示 在 进行 死 锁 检测 之 前 需要 等 待 多 久 。! 默认 是 1000 
坚 秒 。 如 末 你 的 业务 系统 中 有 大 量 更 新 操作 ， 那 么 建议 增 大 该 值 以 
减少 死 锁 检测 的 次 数 ， 


站 每 次 发 生 锁 等 待 时 都 做 死 锁 检测 。 一 一 译 者 














与 其 依赖 这 个 参数 来 解决 死 锁 ， 我 们 更 建议 在 UPDATE 语句 中 
加 NOWAIT 子 句 来 避免 死 锁 ， 例 如 : SELECT FOR _ UPDATE 
NOWAIT . . . 。 


该 语句 会 在 发 生死 锁 时 目 动 终 止 执行 。 


在 PostgreSQL 9.5 中 ， 用 户 还 有 男 一 个 选择 : SELECT FOR 
UPDATE SKIP LOCKED ， 该 语法 可 以 跳 过 已 经 被 别 的 用 户 锁定 的 记 
录 。 


statement timeout 


该 参数 可 以 控制 一 个 语句 能 够 执行 的 最 长 时 间 ， 超 出 限定 的 时 
间 后 该 语句 会 被 目 动 终止 。 该 参数 的 默认 值 是 0， 即 无 限制 。 如 采 
你 需要 对 一 个 运行 可 能 耗 时 很 久 的 函数 加 上 最 长 运行 时 间 限 制 ， 那 
么 最 好 不 要 把 这 个 参数 设置 为 全 局 级 别 ， 仪 在 要 控制 的 函数 的 定义 
中 针对 该 函数 自身 设置 一 下 即 可 。 这 样 可 以 保证 不 会 有 “误杀 ”的 情 
况 发 生 ， 因 为 我 们 无 法 预料 别 的 语句 是 否 需要 执行 更 长 时 间 。 如 采 
人 那么 调用 该 函数 的 事务 也 会 跟着 被 
回 滚 掉 。 














lock timeout 


该 参数 控制 锁 等 待 的 最 长 时 间 ， 超 出 限定 时 间 后 等 待 锁 的 语句 
就 会 被 自动 终止 。 对 于 执行 数据 更 新 的 语句 来 说 ， 该 参数 有 较 大 价 
值 ， 因 为 每 次 更 新 数据 之 前 都 必须 先 获 取 符 修改 的 记录 上 的 排他 
锁 ， 所 以 更 新 语句 之 间 是 最 容易 发 生 锁 等 竺 的 。 该 参数 的 默认 值 为 
0， 表 示 不 限制 锁 等 待 的 时 间 。 一 般 会 在 函数 级 或 者 会 话 级 设置 该 
参数 。lock_timeout 的 值 应 该 设 得 比 statement_timeout 小 ， 
否则 总 会 是 语句 先 超时 ， 这 样 lock_timeout 就 毫 无 意义 了 。 














idle in transaction session timeout 


该 参数 表示 一 个 事务 可 以 处 于 idle 状态 的 最 长 时 间 ， 超 过 限定 
的 时 间 后 该 事务 会 被 自动 回 滚 。 该 参数 的 默认 值 为 0， 表示 事务 可 
以 永久 处 于 idle 状态 。 该 参数 是 9.6 版 引入 的 ， 可 以 起 到 两 个 作 
用 : 防止 一 个 空 末 事务 占 着 记录 锁 一 直 不 释放 从 而 阻 豆 别 的 事务 继 
续 运 行 ， 还 可 以 防止 一 个 数据 库 连 接 被 一 个 空闲 事务 永远 占用 。 


碍 看 被 阻 豆 语句 的 情况 


从 9.1 版 开始 ，pg_stat_activity 视图 发 生 了 较 大 变化 ， 一 些 字 
段 的 名 称 发 生 了 变化 ， 一 些 字段 被 删除 了 ， 另 外 也 新 增 了 一 些 字 
段 。 从 9.2 版 开始 ， 该 视图 中 原来 的 procpid 字段 被 改名 为 pid 





在 PostgreSQL 9.6 中 ，pg_stat_activity 视图 中 增加 了 更 多 关于 
等 待 锁 的 语句 的 信息 。 在 之 前 的 版 本 中 ， 有 一 个 名 为 waiting 的 
布尔 型 字段 ， 其 值 为 true 时 表示 该 会 话 上 有 个 语句 正在 等 待 别 的 
语句 释放 资源 ， 但 看 不 出 是 在 等 待 获 取 什 么 资源 。9.6 版 

中 ，waiting 字段 被 取消 ， 蔡 代 它 的 是 两 个 名 为 

wait_event type 和 wait_event 的 字段 ， 其 中 记录 了 当前 会 话 
上 的 语句 在 等 待 什么 资源 。 因 此 在 9.6 版 之 前 ， 可 以 使 用 waiting 
= true 过 滤 条 件 但 出 所 有 被 别人 阻塞 的 语句 ;9.6 版 之 后 ， 应 更 改 
为 使 用 wait_event IS NOT NULL 过 滤 条 件 来 查找 被 阻塞 的 语 
句 。 


除了 pg_stat_activity 视图 的 结构 发 生 了 变化 外 ，PostgreSQL 
9.6 中 还 对 一 些 之 前 版 本 中 无 法 通过 waiting = true 过 滤 出 来 的 
锁 等 待 进行 了 跟踪 ， 这 样 用 户 就 可 以 看 到 之 前 版 本 中 无 法 查询 出 来 
的 更 轻 量 级 的 锁 等 待 。 如 需 了 解 wait_event 字段 所 有 可 能 的 值 ， 
请 参考 官方 手册 中 关于 等 待 事件 名 和 类 型 的 说 明 。 























01. 2.3 角色 


PostgreSQL 中 使 用 角色 《role) 机 制 来 处 理 用 户 映 份 认证 。 拥 有 登 
录 数 据 库 权限 的 角色 称 为 可 登录 角色 (login role) 。 一 个 角色 可 
以 继承 其 他 角色 的 权限 从 而 成 为 其 成 员 角 色 (memberrole) ; 拥 
有 成 员 角 色 的 角色 称 为 组 角色 “(group role) 。 一 个 组 角色 可 以 
是 男 一 个 组 角色 的 成 员 角 色 ， 并 且 这 种 角色 间 的 继承 关系 可 以 有 无 
限 多 层 ， 但 除非 你 非常 有 把 握 能 搞定 这 种 多 层 舱 套 关 系 ， 否 则 别 这 
么 干 ， 因 为 你 最 后 一 定 会 把 自己 搞 糊 涂 。) 拥有 登录 权限 的 组 角色 
称 为 可 登录 的 组 角色 (group login role) 。 然 而 ， 基 于 安全 性 的 考 
虑 ， 数 据 库 管 理 员 一 般 不 会 为 组 角色 授予 登录 权限 ， 因 为 设计 组 角 
色 的 本 意 是 将 其 作为 一 个 “权限 集合 ”使 用 ， 而 不 是 将 其 作为 一 个 真 
正 需 要 登录 权限 的 用 户 角 色 来 使 用 。 一 个 角色 可 被 授予 超级 用 户 
CSUPERUSER) 权限 ， 拥 有 此 权限 的 角色 可 以 彻底 地 控制 
PostgreSQL 服务 ， 因 此 授予 这 种 权限 时 一 定 要 慎重 。 


















































2 设计 "组 角色 ”这 一 功能 的 本 意 是 为 了 将 一 组 权限 集中 在 一 起 成 为 一 个 "组 "， 然 后 便于 
以 “组 "为 单位 对 这 些 权限 进行 管理 ， 比 如 可 以 通过 角色 权限 继承 的 方式 一 次 性 将 这 一 组 
权限 赋予 其 成 员 角 色 。 一 一 译 者 注 












































从、 PostgreSQL 从 最 近 的 几 个 版 本 开始 不 再 使 用 “用 

户 ” 和 “组 ”这 两 个 术语 。 但 你 还 会 看 到 有 人 使 用 这 两 个 术语 ， 
请 记 住 <“ 用户” 和 “组 ”分 别 代表 “可 登录 角色 ”和 “组 角色 ”就 好 
了 。 为 保持 前 向 兼容 ，CREATE USER 和 CREATE GROUP 这 两 
个 命令 在 当前 版 本 中 也 是 支持 的 ， 但 最 好 不 要 使 用 它们 ， 请 使 
用 CREATE ROLE 。 


2.3.1 创建 可 登录 角色 


在 PostgreSQL 安装 过 程 中 的 数据 初始 化 阶段 ， 系 统 会 默认 创建 一 
个 名 为 postgres 的 可 登录 角色 (同时 会 创建 一 个 名 为 postgres 
的 同名 database) 。 你 可 以 通过 前 面 介绍 过 的 ident 或 者 peer 身份 
验证 机 制 来 将 操作 系统 的 root 用户 映 射 到 数据 库 的 postgres 角 
色 ， 这 样 可 以 实现 root 用 户 免 密 登 录 ， 或 者 通过 设置 为 trust 模式 
的 效果 也 是 一 样 。 数 据 库 安 装 完成 后 ， 第 一 件 要 做 的 事 束 是 用 psql 








或 者 pgAdmin 工具 以 postgres 角色 吴 份 登录 ， 然 后 创建 其 他 已 规 
划 好 的 角色 。pgAdmin 工具 中 有 专门 的 图 形 界面 用 于 创建 角色 ， 如 
果 你 希望 用 SQL 语句 手动 创建 ， 请 参考 示例 2-5 中 的 SQL 语句 。 


示例 2-5 ”创建 具备 登录 权限 的 角色 


CREATE ROLE leo LOGIN PASSWORD "king” VALID UNTIL "infinity” CREATEDB ; 


VALID 子 句 是 可 选 的 ， 其 功能 是 为 此 角色 的 权限 设 定 有 效 期 ， 如 果 
不 写 则 该 角色 永久 有 效 。CREATEDB 子 句 表明 为 此 角色 赋予 了 创建 
新 数据 库 的 权限 。 


如 果 要 创建 一 个 具备 超级 用 户 权限 的 角色 ， 可 以 参考 示例 2-6。 当 
然 ， 要 想 创建 一 个 超级 用 户 ， 创 建 者 上 自身 也 必须 是 一 个 超级 用 户 。 


示例 2-6 创建 具备 超级 用 户 权限 的 角色 


CREATE ROLE regina LOGIN PASSWORD ‘queen' VALID UNTIL '2626-1-1 66:66， 


前 面 两 个 例子 中 我 们 创建 的 都 是 可 登录 角色 ， 如 果 需 要 创建 不 可 登 
录 的 角色 ， 省 略 掉 LOGIN PASSNORD 子 句 即 可 。 


2.3.2 ”创建 组 角色 

一 般 不 应 授予 组 角色 登录 权限 ， 因 为 它 是 作为 其 他 角色 的 容器 而 存 
在 的 。 当 然 ， 这 只 是 我 们 基于 实践 经 验 给 出 的 建议 ， 你 也 可 以 为 组 
角色 授予 登录 权限 ， 这 完全 没 问 题 。 

可 以 用 以 下 SQL 创建 组 角色 。 


CREATE ROLE royalty INHERIT 


请 注意 关键 字 INHERIT 的 用 法 。 它 表示 组 角色 royalty 的 任何 一 











个 成 员 角 色 都 将 自动 继承 其 除 “ 超 级 用 户 权 限 ? 外 的 所 有 权限 。 出 于 
安全 考虑 ，PostgreSQL 不 允许 超级 用 户 权 限 通过 继承 的 方式 传递 。 
如 果 不 写 INHERIT ， 默 认 也 会 有 INHERIT 的 效果 ， 但 为 了 清晰 起 
见 ， 建 议 还 是 写 上 。 


如 果 希 望 禁止 组 角色 将 其 权限 授予 成 员 角 色 ， 可 以 加 上 NOINHERIT 
关键 字 。 
以 下 语句 可 以 为 组 角色 添加 成 员 角 色 。 


GRANT royalty TO leo; 
GRANT royalty TO regina; 


有 些 权限 是 无 法 被 继承 的 ， 例 如 前 面 提 过 的 SUPERUSER 超级 用 户 
权限 ， 然 而 成 员 角 色 可 以 通过 SET ROLE 命令 来 实现 “冒名 顶替 ”其 
组 角色 的 身份 ， 从 而 获得 其 父 角 色 所 拥有 的 SUPERUSER 权限 ， 当 
9 期 限 的 ， 仅 限于 当前 会 话 存续 期 间 有 
效 。 举 例如 下 。 


我 们 先 通过 以 下 命令 授予 royalty 组 角色 超级 用 户 权 限 : 


ALTER ROLE royalty SUPERUSER; 


此 时 尽管 leo 是 royalty 的 成 员 角 色 ， 也 继承 了 其 绝 大 多 数 的 权 
限 ， 但 leo 登录 后 依然 不 具备 SUPERUSER 权限 。 但 执行 以 下 语句 
即 可 获取 SUPERUSER 权限 : 


SET ROLE royalty; 


请 记 住 这 种 方法 获取 的 SUPERUSER 权限 仅 在 会 话 存续 期 间 有 效 。 


虽然 这 个 操作 还 辑 看 起 来 有 点 怪异 ， 但 如 果 你 不 希望 自己 在 登录 后 
以 SUPERUSER 的 身份 犯 下 一 些 无 可 挽回 的 错误 ， 那 么 这 个 方法 值 














得 考虑 。 


所 有 用 户 都 可 以 使 用 SET ROLE 这 个 命令 ， 但 还 有 一 个 比 它 更 强大 
的 命令 : SET SESSION AUTHORIZATION ， 该 命令 只 允许 具备 
SUPERUSER 权限 的 用 户 执行 。 为 了 便于 理解 ， 我 们 首先 介绍 
PostgreSQL 中 的 两 个 全 局 变量 : current user 和 session user 
。 执 行 以 下 语句 即 可 查看 这 两 个 变量 的 值 : 


SELECT session user, current user; 


首次 登录 成 功 后 ， 这 两 个 变量 的 值 相同 。 执 行 SET ROLE 会 修改 
current_user 的 值 ， 执 行 SET SESSION AUTHORIZATION 会 同时 
改变 current_user 和 session _user 的 值 。 





以 下 是 SET ROLE 命令 的 主要 特点 。 


SET ROLE 无 须 SUPERUSER 权限 即 可 执行 

SET ROLE 会 修改 current_user 变量 的 值 ， 但 不 修改 
session_user 的 值 。 

一 个 具备 SUPERUSER 权限 的 session_user 同名 角色 可 以 
通过 SET ROLE 设置 为 任何 用 户 。 

非 超级 用 户 可 以 通过 SET ROLE 设置 为 session_user 同名 和 角 
色 或 者 其 所 属 的 组 用 户 。 

SET ROLE 命令 可 以 让 执行 角色 获取 到 所 “扮演 ”角色 的 全 部 权 
限 ，SET SESSION AUTHORIZATION 和 SET ROLE 权限 除外 。 


SET SESSION AUTHORIZATION 是 比 SET _ ROLE 更 为 强大 的 命令 ， 
其 关键 特性 如 下 。 


只 有 超级 用 户 才 可 以 执行 SET SESSION AUTHORIZATION 。 
SET SESSION AUTHORIZATION 权限 在 整个 会 话 存续 期 间 都 是 
有 效 的 ， 也 就 是 说 即使 超级 用 户 通过 SET SESSION 


AUTHORIZATION 来 “扮演 ”了 一 个 非 超级 用 户 ， 只 要 会 话 未 中 


断 ， 都 可 以 在 上 面 再 次 执行 SET SESSION AUTHORIZATION 


全 
命令 。 


SET SESSION AUTHORIZATION 会 将 current_user 和 


session_user 修改 为 要 “扮演 ”的 角色 。 
。 具备 超级 用 户 权 限 的 session_user 同名 角色 可 以 通过 SET 
ROLE 来 “扮演 ”任何 其 他 角色 。 


接 下 来 我 们 通过 一 系列 实验 来 演示 SET ROLE 和 SET SESSION 
AUTHORIZATION 之 间 的 区 别 。 请 先 以 leo 用 户 的 身份 登录 ， 然 后 运 
行 示例 2-7 中 的 代码 。 


示例 2-7 SET ROLE 和 SET AUTHORIZATION 





SELECT session user, current user; 


session user | current user 


SET SESSION AUTHORIZATION regina; 

ERROR: permission denied to set session authorization 
SET ROLE regina; 

ERROR: permission denied to set role "regina" 

ALTER ROLE leo SUPERUSER; 

ERROR: must be superuser to alter superusers 


SET ROLE royalty; 
SELECT session user, current user; 


session user | current _user 
一 一 一 一 一 一 一 一 一 一 一 一 一 一 二 +-------------- 
leo | royalty 
SET ROLE regina; 
ERROR: permission denied to set role "regina" 
ALTER ROLE leo SUPERUSER ; 


SET ROLE regina; 
SELECT session user, current user; 


session user | current_user 
ee 二 +-------------- 
leo | regina 


SET SESSION AUTHORIZATION regina; 


ERROR: permission denied to set session authorization 





-- 退出 此 会 话 然 后 重新 以 leo 身 份 登录 

SELECT session user, current user; 
SET SESSION AUTHORIZATION regina; 
SELECT session user, current user; 




















session user | current user 


SET SESSION AUTHORIZATION 
session user | current user 
a Ee A 
regina | regina 

(1 row) 





在 示例 2-7 中 ，leo 用 户 不 是 超级 用 户 ， 因 此 不 能 使 用 SET 
SESSION AUTHORIZATION 命令 。 同 样 ， 他 也 不 能 通过 SET ROLE 
来 扮演 regina 角色 ， 因 为 他 不 是 regina 组 的 成 员 。 然 而 leo 可 以 通 
过 SET ROLE 来 扮演 royalty 角色 ， 因 为 他 是 royalty 组 的 成 员 《〈 可 
以 把 leo 理解 成 国王 的 伙伴 )。 扮 演 为 royalty 角色 后 ， 虽 然 royalty 
有 超级 用 户 权 限 ， 但 他 却 不 能 再 次 扮演 女王 regina， 因 为 他 并 没有 
继承 到 royalty 的 超级 用 户 权 限 ， 所 以 此 时 SET ROLE 所 能 扮演 的 
角色 范围 还 是 非 超级 用 户 leo 所 能 扮演 的 范围 。 由 于 royalty 组 角色 
具备 超级 用 户 权 限 ， 因 此 他 可 以 主动 授予 其 成 员 角 色 leo 超级 用 户 
权限 。 一 旦 leo 被 提 权 成 为 超级 用 户 ， 他 就 可 以 扮演 regina 了 。 此 
时 他 可 以 使 用 SET SESSION AUTHORIZATION 来 完全 获取 regina 
用 户 的 权限 ，session_user 和 current_user 也 会 都 被 设置 为 


regina。 


01. 2.4 创建 database 
一 个 不 含 任何 附加 子 句 的 最 简单 SQL 语句 即 可 创建 一 个 database: 


CREATE DATABASE mydb ; 


该 命令 会 以 templatel 库 为 模板 生成 一 份 副本 并 将 此 副本 作为 新 
database。 任 何 一 个 拥有 CREATEDB 权限 的 角色 都 能 够 创建 新 的 


database。 


2.4.1 模板 数据 库 


顾名思义 ， 模 板 数据 库 束 是 创建 新 database 时 所 使 用 的 上 骨架。 创建 
新 database 时 ，PostgreSQL 会 基于 模板 数据 库 制作 一 份 副 本 ， 其 中 
会 包含 所 有 的 数据 库 设 置 和 数据 文件 。 


PostgreSQL 安装 好 以 后 默认 附带 两 个 模板 数据 库 : template8 和 
templatel 。 如 果 创 建新 库 时 未 指定 使 用 哪个 模板 ， 那 么 系统 默认 
会 使 用 templatel 库 作 为 新 库 的 模板 。 








全 、 切记 ， 任 何 时 候 都 不 要 对 template9 模板 数据 库 做 任 

何 修改 ， 因 为 这 是 原始 的 干净 模板 ， 如 果 其 他 模板 数据 库 被 搞 
坏 了 ， 基 于 这 个 数据 库 做 一 个 副本 就 可 以 了 。 如 果 你 想 定制 自 
己 的 模板 数据 库 ， 那 么 请 基于 template1 进行 修改 ， 或 者 自 

己 另 外 创建 一 个 模板 数据 库 再 修改 。 对 基于 templatel 或 你 

自 建 的 模板 数据 库 创 建 出 来 的 数据 库 来 说 ， 你 不 能 修改 其 字符 
集 编码 和 排序 规则 。 如 果 你 想 这 么 做 ， 那 么 请 基于 temp1Late6 
模板 来 创建 新 数据 库 。 


基于 某 个 模板 来 创建 新 数据 库 的 基本 语法 如 下 。 


CREATE DATABASE my_db TEMPLATE my_template db; 














你 可 以 使 用 任何 一 个 现存 的 database 作为 创建 新 数据 库 时 的 模板 。 
当 需 要 对 一 个 现存 的 database 进行 复制 时 ， 该 功能 特别 有 用 。 此 
外 ， 你 还 可 以 将 茶 个 现存 的 数据 库 标 记 为 模板 数据 库 ， 对 于 这 种 被 
标记 为 模板 的 数据 库 ，PostgreSQL 会 禁止 对 其 进行 编辑 或 者 删除 。 
任何 一 个 具备 CREATEDB 权限 的 角色 都 可 以 使 用 这 种 模板 数据 库 。 
以 超级 用 户 喘 份 运行 以 下 SQL 可 使 任何 数据 库 成 为 模板 数据 库 。 


UPDATE pg database SET datistemplate = TRUE WHERE datname = "mydb ; 


如 果 你 想 修 改 或 者 删除 被 标记 为 模板 的 数据 库 ， 请 先 将 上 述 语句 中 

的 datistemplate 字段 值 改 为 FALSE ， 这 样 就 可 以 放 开 编辑 限 

i 修改 完 后 记得 将 此 字段 
改 回 来 。 











2.4.2 ”schema 的 使 用 


schema 可 以 对 database 中 的 对 象 进行 逻辑 分 组 管理 。 如 果 你 的 
database 中 有 很 多 表 ， 那 么 管理 起 来 会 很 厂 烦 ， 可 以 考虑 把 它们 分 
门 别 类 放 到 不 同 schema 中 来 进行 管理 。 同 一 个 schema 中 的 对 象 名 
不 允许 重复 ， 但 同一 个 database 的 不 同 schema 中 的 对 象 是 可 以 重 
名 的 。 如 果 你 将 数据 库 中 所 有 表 都 塞 到 默认 的 public schema 中 

(创建 数据 库 时 默认 创建 的 schema) ， 述 早 会 遇 到 对 象 重 名 的 问 
题 。 你 可 以 自行 决定 如 何 管理 和 组 织 schema。 例 如 ， 假 设 要 为 一 
家 航空 公司 设计 开 系统 ， 那 么 可 以 将 飞机 信息 表 及 其 日 常 维护 信 
息 表 放 到 一 个 叫 作 plane 的 schema 中 ， 把 所 有 机 组 人 员 及 其 人 事 
信息 放 到 名 为 employees 的 schema 中 ， 并 把 所 有 乘客 相关 信息 放 
入 名 为 passengers 的 schema 中 ， 这 样 就 把 所 有 信息 分 门 别 类 隔 
离开 了 。 


另外 一 种 常见 的 管理 schema 的 方法 是 基于 角色 的 管理 。 当 系统 拥 
有 多 个 客户 端 并 且 每 个 客户 端的 数据 必须 完全 隔离 时 ， 这 种 方法 特 
别 合适 。 

假设 你 开 了 一 家 “宠物 狗 美容 店 ”( 俗 称 狗 狗 SPA) 。 刚 开始 你 用 一 


张 放 在 public schema 中 的 名 为 dogs 的 表 来 存储 所 有 宠物 狗 的 信 
恩 。 然 后 你 的 两 个 好 朋友 成 了 你 的 客户 。 最 近 政 府 贫 布 了 一 项 新 的 











隐私 保护 条 例 ， 要 求 客户 数据 必须 完全 隔离 ， 即 禁止 一 个 客户 看 到 
男 一 个 客户 的 狗 狗 的 任何 信息 。 为 了 达到 这 个 要 求 ， 你 可 以 为 每 个 
客户 都 建立 一 个 单独 的 schema， 每 个 schema 中 建立 同样 的 一 张 
dogs 表 。 创 建 schema 的 语句 如 下 : 


CREATE SCHEMA customer1; 
CREATE SCHEMA customer2; 


然后 你 把 这 些 狗 狗 的 数据 从 单一 的 dogs 表 分 拆 到 不 同 客户 的 
schema 的 dogs 表 中 。 最 后 为 每 个 schema 创建 一 个 与 之 同名 的 可 
登录 角色 。 所 有 狗 狗 的 信息 现在 完全 被 分 散 到 它们 对 应 的 schema 
下 。 当 用 户 通过 客户 端 登录 到 你 的 数据 库 进 行 美容 预约 操作 时 ， 他 
们 就 只 能 看 到 他 们 各 自 狗 狗 的 相关 数据 。 


别 急 ， 到 这 儿 还 没完 ， 后 面 还 有 更 妙 的 用 法 。 我 们 之 前 让 角色 和 
schema 同名 ， 这 样 就 可 以 用 上 男 外 一 种 很 有 用 的 技巧 ， 在 介绍 这 
个 技巧 之 前 需要 先 介绍 一 下 search_path 这 个 系统 变量 。 


前 面 已 经 说 过 ， 同 一 个 schema 中 的 对 象 是 不 允许 重 名 的 ， 但 不 同 
schema 中 的 对 象 可 以 重 名 。 例 如 ， 在 所 有 12 个 schema 中 都 有 一 
张 同名 的 dogs 表 。 那 么 问题 来 了 ， 当 执行 类 似 SELECT * FROM 
dogs 这 种 语句 时 ，PostgreSQL 是 怎么 知道 要 查 的 是 哪个 schema 中 
的 表 呢 ?这 个 问题 最 简单 的 解决 办 法 是 在 表 名 前 加 上 所 属 schema 
的 名 称 ， 比 如 SELECT * FROM customer1.dogs ; 另 一 种 方法 是 
通过 设置 search_path 变量 来 解决 ， 比 如 可 以 设 定 为 
customer1，public 。 当 执行 查询 语句 时 ， 规 划 器 会 先 到 
customer1 schema 中 查找 dogs ， 找 不 到 再 到 public schema 中 寻 
找 ， 再 找 不 到 就 结束 。 


PostgreSQL 有 一 个 罕 为 人 知 的 系统 变量 叫 作 user ， 它 代表 了 当前 
登录 用 户 的 名 字 。 执 行 SELECT user 就 能 看 到 其 值 。 系 统 变量 
user 和 current_user 完全 相同 ， 用 哪个 都 一 样 。 


别 筷 了 我 们 前 面 将 schema 的 名 称 取得 和 登录 用 户 名 一 致 ， 现 在 可 
以 充分 利用 这 一 点 了 。 接 下 来 在 postgresql.conf 中 将 search_path 
变量 设 成 下 面 这 样 。 

















search path = "$user", public; 


好 了 ， 如 果 当 前 登录 的 角色 是 customer1 ， 那 么 所 有 的 查询 都 会 
优先 去 customer1 schema 中 寻找 目标 表 ， 如 果 找 不 到 才 会 去 
public schema 下 找 。 最 重要 的 一 点 是 ， 这 样 我 们 系统 中 的 SQL 语 
句 就 只 需要 一 种 写法 ， 而 不 用 在 每 个 客户 的 SQL 中 加 上 对 应 的 
schema 名 。 这 样 就 算 你 的 客户 数 增 长 到 几 千 个 甚至 是 几 十 万 个 也 
没关系 ， 系 统 中 所 有 的 SQL 语句 都 不 需要 修改 。 一 些 需 要 所 有 人 
共享 的 公共 表 可 以 放 到 public schema 中 。 


我 们 强烈 推荐 为 每 一 个 扩展 包 创 建 一 个 单独 的 schema 来 容纳 其 对 
象 ( 参 见 2.6.1 节 ) 。 安 装 一 个 新 的 扩展 包 时 ， 会 在 数据 库 服 务 器 
上 创建 大 量 的 表 、 函 数 、 数 据 类 型 以 及 其 他 对 象 。 默 认 情 况 下 它们 
都 会 被 安装 到 public schema 中 ， 这 样 日 积 月 宗之 后 public 
schema 里 面 会 被 搞 得 一 团 糟 。 例 如 ， 完 整 的 PostGIS 扩展 包 安 装 后 
会 创建 数 干 个 函数 ， 如 果 你 此 前 已 经 在 public schema 中 创建 了 一 
些 上 自己 的 表 和 函数 ， 可 以 想象 一 下 ， 在 加 进来 这 几 千 个 表 和 函数 
后 ， 要 从 中 找到 属于 你 目 己 的 那些 是 多 么 痛 兰 的 一 件 事情 ! 


在 安装 扩展 包 之 前 ， 先 为 其 创建 一 个 schema， 语句 如 下 : 


CREATE SCHEMA my_extensions ; 


然后 把 这 个 新 的 schema 加 入 search_path : 


ALTER DATABASE mydb SET search path="'$user', public, my_extensions; 


安装 扩展 包 时 ， 记 得 在 CREATE EXTENSION 语句 中 将 你 为 其 创建 
的 新 schema 声明 为 其 归属 schema。 























仆 、 对 于 现 有 连接 来 说 ，ALTER DATABASE .. SET 
search_path 命令 执行 后 是 不 能 直接 生效 的 ， 你 需要 断 开 此 


连接 并 重 连 才 可 以 。 


01. 2.5 权限 管理 


PostgreSQL 的 权限 管理 机 制 非常 灵活 而 自由 ， 因 此 要 想 管 理 得 当 是 
需要 一 些 技巧 的 。PostgreSQL 的 权限 控制 甚至 可 以 精确 到 字段 和 记 
录 级 别 。 是 的 ， 你 没 看 错 ， 如 有 必要 其 至 可 以 为 同一 张 表 中 每 行 记 
录 的 每 个 字段 单独 设置 其 访问 权限 。 








和 行 级 权限 控制 (RLS，row level security) 是 PostgreSQL 
9.5 中 首次 引入 的 。 访 特性 在 所 有 的 PostgreSQL 服务 实例 中 都 
可 使 用 ， 但 如 果 PostgreSQL 是 运行 在 开启 了 安全 增强 模式 的 
Linux (SELinuxz) 上 ， 还 能 打开 一 些 更 高 级 的 安全 控制 特性 。 


要 想 完整 地 介绍 所 有 关于 权限 管理 的 知识 可 能 需要 好 几 章 的 篇 幅 ， 
因此 本 市 仅 介 绍 正常 使 用 所 必 备 的 知识 ， 同 时 会 指导 你 避 开 一 些 隐 
责 的 “ 雷 区 ”， 这 些 “ 雷 ?一旦 踩 到 ， 会 导致 你 根本 无 法 访问 想 要 访问 
的 内 容 ， 或 者 服务 右上 的 数据 得 不 到 有 效 防护 。 


做 好 PostgreSQL 的 权限 管理 可 不 是 件 很 轻松 的 事 。 利 用 pgAdmin 
工具 的 图 形 化 界面 来 进行 操作 会 简单 一 些 ， 或 者 说 至 少 能 让 你 比较 
清楚 地 了 人 解 到 系统 当前 权限 设置 的 全 貌 。 通 过 pgAdmin 可 以 完成 
绝 大 多 数 权限 管理 工作 。 如 果 你 得 负责 权限 管理 工作 而 你 又 是 个 
PostgreSQL 新 手 ， 那 么 建议 使 用 pgAdmin。 如 果 等 不 了 我 们 按 部 束 
班 地 慢 慢 介绍 ， 你 也 可 以 直接 跳 到 4.2.4 节 去 学 习 。 


2.5.1 权限 的 类 型 


PostgreSQL 有 几 十 种 权限 ， 其 中 的 一 些 基本 不 会 用 到 。 常 见 的 几 种 
权限 包括 SELECT 、INSERT 、UPDATE 、ALTER 、EXECUTE 以 及 
TRUNCATE 。 


大 多 数 权限 需要 上 下 文 ， 也 束 是 需要 绑 定 一 个 特定 的 数据 库 对 象 才 
有 意义 。 例 如 ， 一 个 角色 拥有 ALTER 权限 ， 却 不 指明 在 哪个 数据 
库 对 象 上 拥有 此 权限 ， 这 是 没有 意义 的 。 在 tablel 上 拥有 ALTER 权 
限 ， 在 table2 上 拥有 SELECT 权限 ， 在 function1 上 拥有 EXECUTE 
权限 ， 诸 如 此 类 的 权限 才 有 意义 。 另 外 ， 并 不 是 所 有 权限 都 适用 于 


























所 有 数据 库 对 象 ， 比 如 一 张 表 上 的 EXECUTE 权限 就 完全 说 不 通 。 
有 些 权 限 无 须 绑 定数 据 库 对 象 ， 比 如 CREATEDB 和 CREATE ROLE 
和 PostgreSQL 官方 使 用 privilege 来 表示 “权限 ”， 其 他 数据 

库 中 “权限 ”一 词 可 能 用 right 或 者 permission 来 表达 。 
2.5.2 ”入 门 介绍 


假设 你 已 安装 好 PostgreSQL， 创 建 好 了 一 个 超级 用 户 角 色 并 设 定 好 
了 密码 。 请 参照 以 下 步骤 来 创建 其 他 角色 并 设 定 其 权限 。 

(1) PostgreSQL 在 安装 阶段 会 默认 创建 一 个 超级 用 户 角色 以 及 一 个 
database， 二 者 的 名 称 都 是 postgres 。 请 以 postgres 身份 登录 
服务 器 。 


(2) 在 创建 你 自己 的 首 个 database 之 前 ， 需 要 先 创建 一 个 角色 作为 
此 database 的 所 有 者 ， 所 有 者 可 以 登录 该 库 。 语 法 如 下 : 


CREATE ROLE mydb admin LOGIN PASSWORD 'something'; 


(3) 创建 database 并 设 定 其 所 有 者 : 


CREATE DATABASE mydb WITH owner = mydb_admin; 


(4) 然后 用 mydb_admin 身份 登录 并 创建 schema 和 表 。 








2.5.3 GRANT 
GRANT 命令 是 授予 权限 的 基本 手段 。 基 本 用 法 如 下 。 


GRANT some privilege TO some role; 





| 
请 牢记 以 下 几 条 关于 GRANT 的 使 用 原则 。 


很 显然 ， 只 有 权限 的 拥有 者 才能 将 权限 授 巴 别人， 并且 拥有 者 
上 自身 还 得 有 GRANT 操作 的 权限 。 这 一 点 是 不 言 而 喻 的 ， 因 为 
目 己 没有 的 东西 当然 给 不 了 别人 。 

有 些 权 限 只 有 对 象 的 所 有 者 才能 拥有 ， 任 何 情况 下 都 不 能 授予 
别人 。 这 类 权限 包括 DROP 和 ALTER 。 

对 象 的 所 有 者 天 然 拥 有 此 对 象 的 所 有 权限 ， 不 需要 再 次 授予 。 
然而 请 特别 注意 : 一 个 对 象 的 所 有 者 并 不 天 然 拥 有 此 对 象 的 子 
对 象 。 例 如 ， 虽 然 你 是 某 个 database 的 属 主 ， 但 这 并 不 意味 着 
你 必然 是 该 database 下 所 有 schema 的 属 主 。 


授权 时 可 以 加 上 NITH GRANT 子 句 ， 这 意味 着 被 授权 者 可 以 将 
得 到 的 权限 再 次 授予 别人 ， 从 而 实现 权限 传递 。 示 例如 下 。 


GRANT ALL ON ALL TABLES IN SCHEMA public TO mydb _ admin NITH GRANT 


如 果 和 希望 一 次 性 将 某 一 类 对 象 的 所 有 权限 都 授予 某 人 ， 可 以 使 
用 ALL 关键 字 来 指 代 所 有 对 象 ， 而 不 需要 针对 每 一 个 对 象 都 操 
作 一 遍 。 请 注意 ， 此 处 ALL TABLES 涵盖 了 所 有 的 普通 表 、 外 
部 表 以 及 视图 。 




















GRANT SELECT, REFERENCES, TRIGGER ON 
ALL TABLES IN SCHEMA my_schema TO 


PUBLIC; 





0 可 以 用 PUBLIC 关键 字 来 指 代 所 


GRANT USAGE ON SCHEMA my_schema TO PUBLIC; 


官方 手册 的 “GRANT” 一 节 中 对 GRANT 命令 有 极其 详尽 的 说 明 ， 强 
1 下 此 节 ， 以 免 不 小 心 设 错 权限 导致 系统 安全 
隐患 


系统 会 默认 将 某 些 权 限 授 予 PUBLIC 〈 即 所 有 人 ) 。 这 些 权限 包 
括 : CONNECT 、CREATE TEMP TABLE (针对 


database ) 、EXECUTE (针对 函数 ) 。 有 坚 情 况 下 出 于 安全 竹 诗 ， 
你 可 能 希望 取消 一 些 默 认 权 限 ， 那 么 可 以 使 用 REVOKE 命令 : 


REVOKE EXECUTE ON ALL FUNCTIONS IN SCHEMA my_schema FROM PUBLIC; 


2.5.4 默认 权限 


默认 权限 可 以 简化 权限 管理 工作 ， 该 机 制 多 许 用 户 在 数据 库 对 象 创 
建 之 前 就 对 其 设置 权限 。 








从、 新 增 或 者 修改 四 认 权 限 并 不 会 影响 已 有 的 权限 设置 ， 即 
只 有 当 某 个 对 象 的 某 项 权限 未 专门 设 定 的 情况 下 ， 默 认 权限 设 
定 才 会 生效 。 


假设 我 们 希望 对 所 有 数据 库 用 户 都 授予 某 schema 中 将 来 可 能 创建 
的 所 有 函数 和 表 的 EXECUTE 和 SELECT 权限 ， 那 么 我 们 可 以 按 示例 
2-8 这 样 来 定义 权限 。 一 个 PostgreSQL 服务 实例 中 的 所 有 角色 都 是 
PUBLIC 组 的 成 员 。 


示例 2-8 ”定义 schema 的 默认 权限 











GRANT USAGE ON SCHEMA my_schema TO _ PUBLIC; © 


ALTER DEFAULT PRIVILEGES IN SCHEMA my_schema 
GRANT SELECT， REFERENCES ON TABLES TO _ PUBLIC; @ 


ALTER DEFAULT PRIVILEGES IN SCHEMA my_schema 
GRANT ALL ON TABLES TO mydb_admin WITH GRANT OPTION; © 


ALTER DEFAULT PRIVILEGES IN SCHEMA my_schema @ 
GRANT SELECT，UPDATE ON SEQUENCES TO public; 


ALTER DEFAULT PRIVILEGES IN SCHEMA my_schema © 
GRANT ALL ON FUNCTIONS TO mydb_admin WITH GRANT OPTION 


ALTER DEFAULT PRIVILEGES IN SCHEMA my_schema © 
GRANT USAGE ON TYPES TO PUBLIC ; 





@ 人 允许 所 有 能 够 连接 到 此 database 的 用 户 在 my_schema 中 访问 和 
创建 对 象 ， 同 时 该 用 户 需 要 已 经 具备 访问 此 schema 中 所 有 对 象 的 
权限 。 为 用 户 授 予 某 个 schema 的 USAGE 权限 是 允许 该 用 户 访问 

schema 中 所 有 对 象 的 前 提 条 件 。 如 果 用 户 拥 有 访问 schema 中 某 张 
0 却 没有 该 schema 的 USAGE 权限 ， 则 该 用 户 不 能 访 
问 这 张 表 。 


@ 为 所 有 具备 此 schema 的 USAGE 权限 的 用 户 授予 该 schema 中 后 
续 创 建 的 所 有 表 的 查询 (SELECT ) 和 引用 (REFERENCE ) 权限 
《引用 权限 指 的 是 针对 该 表 的 某 些 字段 建立 外 键 约 束 的 权限 ) 。 


鼻 把 该 schema 中 所 有 后 续 创建 的 表 的 所 有 权限 都 授予 
mydb_admin 角色 。 同 时 还 允许 mydb_admin 组 的 所 有 成 员 将 本 
schema 中 所 有 后 续 创 建 的 表 的 部 分 或 者 全 部 权限 授予 其 他 用 户 。 
所 有 权限 具体 包括 : 插入 记录 、 更 新 记录 、 删 除 记录 、 截 断 表 、 创 
建 触 发 器 、 创 建 约束 等 。 


@@G 针对 本 schema 中 后 续 创 建 的 序列 号 生成 器 、 函 数 、 数 据 类 
型 授予 权限 。 


要 了 解 更 多 关于 默认 权限 的 信息 ， 请 参考 官方 手册 中 “修改 默认 权 
限 ” 一 节 的 内 容 。 


2.5.5 PostgreSQL 权限 体系 中 一 些 与 众 不 同 的 特点 


最 后 ， 在 你 上 自己 去 深入 了 解 权 限 管 理 体 系 之 前 ， 我 们 会 给 你 列举 一 
些 比较 隐蔽 的 “ 奇 葛 ?特性 。 


与 其 他 数据 库 不 同 ，PostgreSQL 中 一 个 database 的 所 有 者 并 不 天 然 
对 此 库 中 的 所 有 对 象 拥有 完全 的 控制 权 。 比 如 另 一 个 角色 可 以 在 你 

















的 库 中 创建 一 张 表 ， 你 虽然 号 为 此 库 的 所 有 者 却 无 权 访 问 这 张 表 ， 
然而 此 时 你 却 有 权 把 整个 库 都 删 兵 。 


在 对 schema 中 的 表 和 函数 做 了 授权 操作 后 ， 一 定 不 要 起 了 授予 
schema 本 身 的 USAGE 权限 。 





01. 2.6 ”扩展 包机 制 


扩展 包 〈extension) 是 一 种 用 于 扩展 PostgreSQL 系统 功能 的 插件 
机 制 ， 该 机 制 的 前 身 被 称 为 “contrib”3 。 该 机 制 很 好 地 体现 了 开源 
界 的 强大 优势 : 人 们 互相 协作 、 共 同 开发 并 自由 分 享 新 的 功能 特 
性 。 自 从 9.1 版 开始 引入 对 extension 扩展 包机 制 以 来 ， 为 
PostgreSQL 添加 功能 扩展 已 经 变 得 非常 方便 快捷 。 


3 extension 与 contrib 本 质 上 都 是 PostgreSQL 的 系统 功能 插件 ， 二 者 功能 类 似 但 实现 机 
制 有 很 大 差异 ， 其 版 本 分 界 点 为 9.1 版 ， 之 前 的 插件 机 制 被 称 为 contrib，9.1 版 及 之 后 的 
插件 机 制 被 称 为 extension。 译 者 注 





















































a 对 于 在 extension 扩展 包机 制 推出 之 前 就 已 存在 的 那些 历 
史 插 件 ， 理 论 上 我 们 应 称 之 为 “contrib” 以 示 差 别 ， 但 放眼 未 
来 ， 这 些 老 的 contrib 势必 都 会 被 改造 为 用 extension 机 制 实 
现 。 为 了 描述 方便 ， 下 文 会 将 二 者 统称 为 “扩展 包 ”， 但 你 应 该 
清楚 二 者 的 区 别 。 


对 于 一 台 PostgreSQL 服务 器 来 说 ， 并 不 是 其 中 每 个 database 都 要 
安装 全 部 的 扩展 包 ， 只 有 当 某 个 database 的 确 需 要 此 扩展 包 提 供 的 
功能 时 才 应 安装 。 如 果 你 的 PostgreSQL 服务 器 上 的 所 有 database 
都 需要 某 些 扩展 包 的 功能 ， 那 么 可 以 新 建 一 个 模板 数据 库 〈 有 关 模 
板 数据 库 的 介绍 ， 请 参见 2.4.1 节 ) ， 然 后 在 此 模板 数据 库 中 预先 
安装 好 这 些 扩展 包 ， 那 么 后 续 的 database 就 能 以 此 模板 数据 库 为 基 
这 样 就 避免 了 每 新 建 一 个 database 就 安装 一 遍 扩 展 包 的 
杯 烦 。 


建议 定期 检查 并 印 载 不 再 需要 的 扩展 包 以 避免 系统 过 于 及 肿 。 将 不 
再 需要 的 老 扩 展 包 保留 在 系统 中 可 能 会 在 PostgreSQL 升级 过 程 中 
引发 问题 ， 因 为 升级 后 的 PostgreSQL 中 需要 把 这 些 扩展 包 所 含有 
的 对 象 原 地 重建 一 遍 。 


要 想 查 看 某 个 database 中 已 经 安装 了 哪些 扩展 包 ， 可 以 连接 到 该 
database， 然 后 执行 示例 2-9 中 的 语句 。 你 的 查询 结果 可 能 和 下 面 
列 出 的 很 不 一 样 ， 这 是 正常 的 。 








示例 2-9 ”查询 某 个 database 中 已 安装 的 扩展 


SELECT name, default version, installed version，1eft(comment ,36) As < 
FROM pg_available extensions 

WHERE installed version IS NOT NULL 

ORDER BY name; 


default version installed version comment 


btree gist 
fuzzystrmatch 
hstore 
ogr_fdw 
pgrouting 
plpgsql 

plv8 

postgis 

(8 rows) 


support for ind 
determine simil 
data type for s 
foreign-data wr 
pgRouting Exten 
PL/pgSQL proced 
PL/JavaScript ( 
PostGIS geometr 


记忆 只 上 
DPPDOPPAPP 





如 果 你 想 查 看 一 个 PostgreSQL 服务 实例 中 所 有 database 安装 的 所 
有 扩展 包 ， 请 把 上 面 查询 语句 中 的 WHERE installed_version 
IS NOT NULL 删 掉 。 


如 果 想 要 了 解 某 个 database 中 已 安装 的 扩展 包 的 更 多 详细 内 容 ， 请 
在 psql 中 执行 类 似 以 下 的 命令 : 


\dx+ fuzzystrmatch 








或 者 执行 以 下 碍 询 也 可 以 : 


SELECT pg describe object(D.classid,D.objid,60) As description 

FROM pg catalog.pg depend AS D INNER JOIN pg catalog.pg extension AS E 
ON D.refobjid = E.oid 

WHERE 


D.refclassid = “pg catalog.pg extension'::pg catalog.regclass AND 
deptype = 'e' AND 
E.extname = 'fuzzystrmatch'; 





查询 结果 显示 了 该 扩展 包 中 包含 了 哪些 内 容 : 


description 


function dmetaphone alt(text) 
function dmetaphone(text) 
function difference(text,text) 
function text soundex(text) 
function soundex(text) 


function metaphone(text,integer) 

function levenshtein less equal(text,text,integer,integer,integer,inte 
function levenshtein less equal(text,text,integer) 

function levenshtein(text,text,integer,integer,integer) 

function levenshtein(text,text) 





扩展 包 中 可 以 包含 各 类 数据 库 对 象 ， 包 括 函 数 、 表 、 数 据 类 型 、 数 
编程 语言 、 运 算 符 ， 等 等 。 但 函数 通常 占 了 其 中 的 
部 分 。 


2.6.1 扩展 包 的 安装 


将 扩展 包 安 装 到 系统 中 需要 两 个 步 又: 首先 ， 下 载 安装 包 并 安 六 到 
数据 库 服务 器 上 ;， 其 次 ， 将 此 扩展 包 安 装 到 目标 database 中 。 














% 我 们 在 前 述 两 个 步 又 中 都 使 用 了 “安装 ”这 个 词 ， 但 其 指 
代 的 具体 动作 是 不 一 样 的 ， 当 上 下 文 环境 不 清楚 时 ， 我 们 会 加 
以 描述 区 分 。 


以 下 我 们 将 介绍 扩展 包 的 安装 方法 ， 同 时 也 将 介绍 在 不 支持 
extension 扩展 包机 制 的 老 版 本 PostgreSQL 上 安装 contrib 扩展 包 的 
方法 。 
a， 步 又 一 : 将 扩展 包 安 装 到 数据 库 服务 器 这 
一 步 的 具体 做 法 会 根据 操作 系统 的 不 同 而 有 所 不 同 。 总 的 来 说 
就 是 先 下 载 该 扩展 包 的 安装 文件 以 及 所 依赖 的 库 文 件 ， 然 后 将 


它们 分 别 复制 到 操作 系统 的 bin 和 lib 文件 夹 ， 同 时 把 SQL 脚 
本 文件 复制 到 share/extension 文件 夹 (9.1 版 及 之 后 版 本 ) 或 











者 share/contrib 文件 夹 〈9.1 版 之 前 的 版 本 ) 。 这 样 就 为 接 下 
来 执行 第 二 步 做 好 了 准备 。 


对 于 较 小 的 扩展 包 来 说 ， 其 所 需 的 很 多 库 文件 在 PostgreSQL 
安装 好 以 后 就 有 了 ， 或 者 没有 的 话 也 可 以 通过 yum 或 apt 

get postgresql-contrib 命令 较 容易 地 获取 到 。 对 于 通过 
以 上 方式 获取 不 到 的 库 文件 ， 你 要 么 自行 编译 ， 要 人 么 找 一 下 别 
人 已 经 编译 好 的 安装 包 ， 要 么 从 另 一 台 环 境 完 全 相同 的 服务 器 
上 把 库 文 件 复制 过 来 。 对 于 PostGIS 这 类 较 大 的 扩展 包 ， 通 常 
可 以 从 你 下 载 PostgreSQL 的 站 点 下 载 到 完整 的 安装 包 。 如 果 
想 了 解 当前 服务 器 上 有 哪些 扩展 包 可 用 ， 请 执行 以 下 命令 : 


SELECT * FROM pg _available extensions; 


. 步骤 二 : 将 扩展 包 安 装 到 指定 的 database 中 


扩展 包机 制 使 得 扩展 特性 的 安装 过 程 更 加 人 简单。 使 用 CREATE 
EXTENSION 命令 即 可 将 扩展 包 安 装 到 指定 的 database 中 。 相 比 
原来 的 安装 方法 ， 该 新 机 制 有 三 大 主要 优点 : 首先 ， 用 户 不 需 
要 弄 清 楚 扩 展 包 文 件 存放 的 具体 路 径 〈share/extension ) ; 其 
次 ， 可 以 通过 DROP EXTENSION 命令 方便 地 卸载 扩展 包 ; 最 
后 ， 文 持 查 看 当前 已 安装 和 可 安装 的 扩展 包 列 表 。PostgreSQL 
安装 包 中 已 经 附带 了 最 利用 的 知 干 扩展 包 。 通 过 PostgreSQL 
Extension Network 站 点 可 以 下 载 到 PostgreSQL 安装 包 中 默认 
未 附带 的 扩展 包 。GitHub 站 点 上 也 有 很 多 PostgreSQL 扩展 
包 ， 只 需 搜 索 “postgresql extension” 关 键 字 就 能 找到 。 


以 下 是 安装 fuzzystrmatch 扩展 包 的 命令 : 


CREATE EXTENSION fuzzystrmatch; 


你 仍 可 以 使 用 psql 以 非 交 互 方式 安装 扩展 包 。 先 连接 到 需要 安 
装 此 扩展 包 的 database， 然 后 执行 类 似 以 下 命令 行 : 

















psql -p 5432 -d mydb -c "CREATE EXTENSION fuzzystrmatch;" 


从、 基于 C 语言 的 扩展 包 必 须 由 具备 超级 用 户 权限 的 角 
色 来 安装 。 大 多 数 扩展 包 都 是 基于 C 语言 的 。 


强烈 建议 你 创建 专门 的 schema 来 安装 扩展 包 ， 以 确保 扩展 包 
数据 与 业务 数据 隔离 。 建 好 schema 后 ， 执 行 以 下 命令 来 将 其 
指定 给 待 安装 的 扩展 包 : 


CREATE EXTENSION fuzzystrmatch SCHEMA my_extensions; 


.升级 PostgreSQL 版 本 以 文 持 新 的 extension 扩 展 包 机 制 


如 果 你 从 PostgreSQL 9.1 或 者 更 早 的 版 本 升级 到 了 9.1 版 或 者 
之 后 的 版 本 ， 并 且 也 正确 地 将 数据 从 老 版 本 导入 到 了 新 版 本 之 
中 ， 那 么 之 前 安装 的 那些 contrib 扩展 包 依 然 是 可 以 正常 工作 
的 。 但 为 了 简化 管理 并 提升 可 维护 性 ， 你 应 该 将 存放 于 contrib 
文件 夹 中 的 那些 老 扩 展 包 升 级 为 新 格式 的 extension 扩展 包 。 
这 种 格式 升级 是 完全 可 以 实现 的 ， 尤 其 是 对 那些 随 PostgreSQL 
版 本 附带 的 扩展 包 来 说 更 加 没 问 题 。 不 过 请 注意 ， 这 里 说 

的 “升级 ”是 指 从 contrib 格式 到 extension 格式 的 “格式 升级 ”， 
而 不 是 指 扩展 包 本 身 的 “功能 升级 ”。 


例如 ， 如 果 你 之 前 在 一 套 PostgreSQL 9.0 版 的 contrib 
schema 中 安装 了 tablefunc 扩展 包 ( 这 是 一 个 用 于 实现 跨 表 
查询 的 功能 插件 ) ， 然 后 你 将 该 系统 升级 到 了 9.1 版 ， 那 么 可 
以 执行 以 下 命令 来 升级 此 插件 : 


CREATE EXTENSION tablefunc SCHEMA contrib FROM unpackaged; 


该 命令 会 搜索 contrib schema〔( 假 设 你 已 把 所 有 的 扩展 包 都 
安装 在 这 里 面 )， 找 到 所 有 属于 tablefunc 插件 的 成 员 对 























象 ， 然 后 把 它们 按照 新 的 extension 扩展 包 模 型 格式 进行 封 

装 ， 这 样 该 扩展 包 就 会 出 现在 pg _available_extensions 视 
图 信息 中 ， 束 好 像 是 全 新 安装 的 一 个 extension 扩展 包 一 样 。 
这 样 就 实现 了 从 contrib 到 extension 的 扩展 包 格 式 升 级 。 


该 命令 会 将 contrib schema 中 的 插件 函数 按 extension 模式 进 
行 封装 格式 升级 ， 函 数 本 喘 不 会 有 任何 改动 ， 但 此 后 该 
database 进行 备份 时 不 会 包含 这 些 函 数 ， 因 为 它们 的 身份 已 经 
发 生 了 变化 ， 从 与 别 的 函数 身份 无 法 区 分 的 普通 函数 变 为 
extension 扩展 包 中 的 函数 。 


2.6.2 ”通用 扩展 包 


通用 扩展 包 是 指 那 些 因 功能 比较 基本 和 通用 而 在 PostgreSQL 安装 
包 中 默认 附带 的 一 些 扩展 包 ， 但 它们 不 一 定 会 被 默认 安装 ， 具 体 视 
其 功能 而 定 。 有 些 早期 的 通用 扩展 包 已 被 PostgreSQL 内 核 接 纳 从 
而 “ 登 党 入 室 ” 成 为 系统 基础 功能 ， 因 此 如 果 你 是 从 较 老 版 本 的 
PostgreSQL 升级 上 来 的 话 ， 可 能 会 发 现 原 先 要 通过 安装 扩展 包 才 能 
实现 的 功能 现在 已 成 了 系统 默认 提供 的 功能 。 


a， 比较 常用 的 扩展 包 介 绍 


从 9.1 版 开始 ，PostgreSQL 官方 推荐 开发 人 员 使 用 extension 
扩展 包 模 式 来 为 系统 制作 功能 插件 。 从 仪 包含 函数 和 数据 类 型 
的 基本 插件 到 包含 了 存储 过 程 语言 支持 (PL) 、 索 引 类 型 以 及 
外 部 数据 封装 器 的 高 级 插件 ， 都 可 以 用 extension 扩展 包机 制 
来 实现 。 本 节 列 举 了 最 常用 (也 有 些 人 称 之 为 “ 必 备 ”) 但 默认 
情况 下 PostgreSQL 并 未 安装 的 一 些 扩展 包 。 你 会 发 现下 面 列 
出 的 很 多 扩展 包 在 你 的 PostgreSQL 系统 中 己 经 有 了 ， 具 体 哪 
些 有 哪些 没有 取决 于 你 使 用 的 是 哪个 PostgreSQL 发 行 版 ， 不 
同 发 行 版 之 间 可 能 会 略 有 差异 。 























btree gist 


该 扩展 包 实 现 了 基于 B- 树 索引 算法 的 GiST 索引 运算 符 
类 ， 适 用 于 B- 树 索引 文 持 的 所 有 数据 类 型 ， 其 具体 效 末 与 标 
准 的 B- 树 索引 类 似 。 更 多 细节 请 参见 6.3.1 节 的 内 容 。 


btree gin 


该 扩展 包 实 现 了 基于 B- 树 索引 算法 的 GIN 索引 运算 符 
类 ， 适 用 于 B- 树 索引 文 持 的 所 有 数据 类 型 ， 其 具体 效果 与 标 
准 的 B- 树 索引 类 似 。 更 多 细节 请 参见 6.3.1 节 的 内 容 。 


postgis 


该 扩展 包 将 PostgreSQL 变 成 了 一 个 业界 最 先进 的 空间 数 
据 库 ， 而 且 其 品质 胜 过 了 所 有 类 似 的 商业 化 产品 。 如 果 你 需要 
处 理 标准 的 OGC GIS 数据 、 人 口 统计 学 数据 、 地 理 编码 数 
据 、3D 数据 甚至 是 电子 光栅 数据 ， 那 么 postgis 会 是 你 的 必 
备 之 选 。 我 们 编写 的 图 书 PostGIS in Action 中 对 PostGIS 做 了 
更 加 详尽 的 介绍 。PostGIS 是 扩展 包 界 的 “ 巨 无 霸 ”， 它 包含 
800 多 个 函数 、 自 定义 数据 类 型 以 及 空间 索引 等 对 象 。PostGIS 
如 此 庞大 ， 以 至 于 有 人 为 它 开 发 二 次 扩展 包 。 有 些 二 次 扩展 包 
是 PostGIS 安装 包 自 带 的 ， 当 然 也 有 一 些 不 是 ， 其 中 有 两 个 特 











别 值 得 一 提 : 一 个 是 pgpointcloud ， 它 可 以 管理 点 云 数 据 
(地 理 信息 系统 中 海量 的 点 组 成 的 集合 ) ， 另 一 个 是 


pgRouting， 它 可 以 进行 网 络 路 径 分 析 。 
fuzzystrmatch 


这 是 一 个 用 于 字符 串 模 糊 匹 配 的 轻 量 级 扩展 包 ， 包 含 了 诸 
如 soundex 、levenshtein 和 metaphone 等 算法 。 我 们 
在 “Where is Soundex and Other Fuzzy Things” 这 篇 文章 中 介绍 了 
该 扩展 包 的 用 法 。 











hstore 


该 扩展 包 为 PostgreSQL 添加 了 对 键 值 数据 库 的 支持 ， 同 
时 也 支持 索引 ， 非 常 适用 于 存储 非 结构 化 数据 。 如 果 你 正在 寻 
找 一 种 介 于 关系 型 数据 库 和 NoSQL 数据 库 之 间 的 产品 ， 可 以 
尝试 一 下 hstore 。 很 多 原先 适用 hstore 的 场景 已 经 可 以 用 
内 置 jsonb 类 型 来 蔡 代 ， 因 此 这 个 扩展 包 已 经 不 像 以 前 那么 
流行 。 





pg_ trgm (trigram ) 


该 扩展 包 提 供 了 另外 一 种 字符 串 模 糊 搜 索 算 法 库 ， 可 与 
fuzzystrmatch 配合 使 用 。 该 扩展 包 包 含 一 种 运算 符 类 ， 使 
得 基于 ILIKE 的 搜索 操作 能 用 上 索引 。 该 扩展 还 能 够 让 形 如 
LIKE '%something%' 的 通配符 查询 或 者 是 形 如 somefield 
~ "(foo|bar)' 的 正则 表达 式 人 查询 用 上 索引 。 关 于 这 部 分 内 
容 ， 在 “Teaching ILIKE and LIKE New Tricks” 这 篇 博文 中 有 更 
深入 的 探讨 。 


dblink 








该 扩展 包 支 持 从 一 台 PostgreSQL 服务 器 远程 访问 男 一 台 
PostgreSQL 服务 器 上 的 数据 。 在 9.3 版 中 引入 对 外 部 数据 源 的 
文 持 之 前 ，dblink 是 唯一 能 够 实现 跨 数 据 库 交互 的 机 制 。 目 
前 该 机 制 一 般 用 于 需要 临时 性 连接 到 外 部 数据 源 或 者 临时 的 即 
席 碍 询 场景 ， 特 别 是 需要 调用 外 部 数据 源 一 侧 的 函数 时 会 有 
用 。 在 PostgreSQL 9.6 之 前 ，postgres_fdw 不 允许 调用 远 端 
PostgreSQL 服务 器 上 除 原 生 函 数 之 外 的 函数 ， 比 如 远 端 
PostgreSQL 安装 了 扩展 包 后 所 文 持 的 新 函数 就 不 能 调用 。 在 
PostgreSQL 9.6 中 ， 你 可 以 预先 声明 远 端 服务 器 上 已 安装 某 扩 
展 包 ， 那 么 就 可 以 在 本 地 调用 远 端 PostgreSQL 服务 器 上 安装 
的 扩展 包 中 的 函数 了 。 





pgcrypto 


该 扩展 包 提 供 了 一 系列 的 加 密 工具 ， 包 括 使 用 广泛 的 PGP 
算法 。 使 用 该 扩展 包 提 供 的 功能 来 对 数据 库 中 存储 的 信用 卡号 
码 或 其 他 顶级 机 密 信 息 进 行 加 密 是 非常 方便 的 。 在 “Encrypting 
Data with pgcrypto” 这 篇 博文 中 我 们 对 其 用 法 进行 了 快速 的 入 门 


介绍 。 








. 经 典 扩 展 包 介绍 


此 处 我 们 介绍 几 个 经 典 的 “曾经 的 扩展 包 ”。 之 所 以 称 之 为 “ 曾 
经 的 扩展 包 ”， 是 因为 它们 使 用 非常 广泛 ， 并 因此 被 
PostgreSQL 官方 接纳 而 成 为 了 系统 内 核 功 能 的 一 部 分 。 但 在 老 
版 本 的 PostgreSQL 上 ， 它 们 还 是 以 扩展 包 的 形式 存在 。 你 在 
实际 工作 中 有 可 能 过 到 这 些 老 版 本 ， 所 以 还 是 有 必要 介绍 一 下 
这 些 曾经 的 扩展 包 。 





tsearch 


该 扩展 包 封 装 了 一 系列 用 于 强化 全 文 搜索 功能 的 索引 、 运 
算 符 、 目 定义 词典 和 函数 。 目 前 该 扩展 包 的 功能 已 被 系统 内 核 
接纳 并 成 为 PostgreSQL 基础 功能 的 一 部 分 。 如 果 你 使 用 的 
PostgreSQL 版 本 较 老 ， 在 其 上 tsearch 还 是 以 扩展 包 的 形式 
存在 ， 那 么 建议 你 升级 到 tsearch2 这 个 新 版 本 。 当 然 ， 最 好 
的 做 法 其 实 是 将 PostgreSQL 服务 器 软件 升级 到 新 版 本 ， 因 为 
老 版 本 上 的 tsearch 插件 的 兼容 性 支持 随时 可 能 终止 ， 这 会 
导致 你 在 老 版 本 的 PostgreSQL 上 再 也 无 法 享受 到 相关 的 功能 
更 新 和 bug 修复 。 


Xml] 


该 扩展 包 提 供 了 对 XML 数据 类 型 的 文 持 以 及 相关 的 函数 
和 运算 符 。 为 了 达到 ANSI SQL XML 标准 的 要 求 ， 
PostgreSQL 内 核 接纳 了 该 插件 包 的 部 分 功能 。 其 余 未 被 纳入 内 
核 的 那 部 分 功能 仍 以 扩展 包 的 形式 存在 ， 不 过 已 改名 为 xm12 
。 具 体 来 说 ， 如 果 你 需要 使 用 xlst_process 函数 来 处 理 
XSL 模板 数据 ， 那 么 就 需要 安装 xm12 扩展 包 。 另 外 ，xm12 
扩展 包 中 还 含有 一 些 XPath 函数 。 


01. 2.7 备份 与 恢复 


PostgreSQL 自身 附带 了 三 个 备份 工具 : pg_dump 、pg_dumpall 和 
pg_basebackup ， 三 者 均 位 于 bin 文件 夹 下 。 


pg_dump 用 于 备份 一 个 指定 的 database， 而 pg_dumpall 可 一 次 性 
备份 所 有 database 的 数据 以 及 系统 全 局 数据 。 由 于 pg_dumpall 需 
要 能 够 访问 系统 中 的 所 有 database， 因 此 必须 由 具备 SUPERUSER 
权限 的 角色 来 执行 。pg_basebackup 可 以 针对 所 有 database 实现 
系统 级 的 磁盘 备份 。 


本 节余 下 的 内 容 将 着 重 讨论 pg_dump 和 pg_dumpall 
。pg_basebackup 是 实现 整个 PostgreSQL 服务 器 备份 的 最 有 效 工 
具 。 如 果 你 的 数据 库 足 够 大 ， 比 如 500GB 或 者 更 大 ， 那 么 你 应 该 
将 pg_basebackup 作为 你 备份 策略 中 的 一 个 重要 工具 。 使 用 
pg_basebackup 时 需要 打开 一 些 系统 参数 ， 这 些 参数 一 般 是 关闭 
的 。 另 外 ， 这 些 参数 在 配置 复制 功能 时 也 要 用 到 ， 因 此 我 们 把 这 部 
分 留 到 10.2 节 再 讨论 。 


这 两 个 工具 的 大 多 数 命令 行 选项 都 可 以 有 两 种 写法 : 一 种 是 GNU 

风格 《两 个 横 杠 连 字 符 后 跟 一 个 单词 ) ; 另 一 种 是 传统 的 单字 母 风 
格 〈 一 个 横 杠 连 字 符 后 跟 一 个 字母 ) 。 这 两 种 写法 是 完全 等 价 的 ， 

甚至 在 同一 个 命令 行 中 也 可 以 混用 。 本 节 仅 讨论 一 些 基 本 的 用 法 ， 

如 果 要 了 解 更 多 深入 的 内 容 ， 请 参考 PostgreSQL 官方 手册 中 的 “ 备 
份 与 恢复 ”。 


业界 也 有 一 些 常 用 的 第 三 方 工 具 来 实现 PostgreSQL 的 备份 和 恢 
复 ， 但 本 市 不 会 详细 讨论 。 两 个 用 得 比较 多 的 开源 工具 是 
pgBackRest 和 Barman。 相 比 官方 原生 的 工具 ， 它 们 多 了 定时 备 
份 、 多 服务 器 备份 以 及 快捷 恢复 等 功能 。 


在 学 习 本 布 内 容 时 ， 你 会 发 现 我 们 一 般 会 在 示例 命令 行 中 指明 目标 
数据 库 所 在 的 主机 地 址 和 侦 听 端口 ， 这 是 因为 我 们 一 般 是 在 另外 一 
台 机 器 上 通过 执行 pgAgent 定时 任务 的 方式 来 执行 备份 ， 这 种 情况 
下 必须 在 命令 行 写 明 目标 数据 库 的 地 址 和 侦 听 端口 ， 详 情 将 在 4.5 

节 讨 论 ， 或 者 另外 一 种 情况 是 在 同一 人 台 机 器 上 运行 多 个 PostgreSQL 
































服务 实例 ， 实 例 间 的 侦 听 端口 互 不 相同 ， 所 以 命令 行 中 必须 明确 指 
定 IP 和 端口 。 有 一 个 情况 请 注意 : 如 果 你 的 服务 被 设置 为 仅 侦 听 
localhost， 会 导致 默认 情况 下 只 有 来 自 本 机 的 连接 才 会 被 允许 接 

和 入， 这样 远 端 机 器 上 的 备份 恢复 工具 会 无 法 连接 。 如 果 备 份 任务 是 
直接 在 数据 库 服 务 器 本 机 上 执行 的 ， 那 么 仅 侦 听 localhsot 是 完全 没 


问题 的 。 


pg_dump 和 pg_dumpall 工具 不 支持 在 命令 行 选项 中 设 定 登 录 密 
码 ， 因 此 为 了 便于 执行 自动 任务 ， 你 需要 在 postgres 操作 系统 账 
户 的 home 文件 夹 下 创建 一 个 密码 文件 .pgpass 来 存储 密码 ; 或 者 也 
可 以 用 PGPASSWORD 环境 变量 来 设 定 密码 。 


2.7.1 使 用 pg _dump 进行 有 选择 性 的 备份 


如 果 你 希望 每 天 都 进行 备份 ， 那 么 使 用 pg_dump 比 pg_dumpal1 
更 合适 ， 因 为 前 者 文 持 精确 指定 要 备份 的 表 、schema 和 database， 
而 后 者 不 支持 。pg_dump 可 以 将 数据 备份 为 SQL 文本 文件 格式 ， 
也 支持 备份 为 压缩 格式 、TAR 包 格 式 或 者 目录 格式 。 在 用 
pg_restore 进行 数据 恢复 时 ， 前 述 三 种 格式 的 备份 文件 都 可 以 实 
现 并 行 恢复 。 用 pg_dump 进行 备份 时 ， 选 择 目 录 格 式 可 以 实现 并 
行 备份 ， 因 此 如 果 要 备份 的 数据 库 非 常 大 ， 可 以 考虑 使 用 目录 格 


了 

我 们 认为 pg_dump 是 你 进行 日 常备 份 时 不 可 或 缺 的 工具 ， 因 此 我 
们 在 附录 B.1 市 提供 了 一 张 完 整 的 pg_dump 帮助 信息 清单 ， 这 样 
你 就 可 以 对 其 数量 众多 的 选项 开关 用 法 一 目 了 然 。 


下 面 的 例子 展示 了 一 些 常 见 的 备份 场景 以 及 相应 的 pg_dump 选 
项 。 这 些 例子 对 于 任何 版 本 的 PostgreSQL 应 该 都 是 适用 的 。 


备份 菏 个 database， 备 份 结果 以 目 定义 压缩 格式 输出 : 


pg_dump -h localhost -p 5432 -U someuser -F ¢ -b -v -f mydb.backup myd 


备份 某 个 database， 备 份 结果 以 SQL 文本 方式 输出 ， 命 令 中 带 -C 
选项 ， 输 出 结果 中 包含 CREATE DATABASE 语句 ; 























pg_dump -h localhost -p 5432 -U someuser -C -F p -b -v -fmydb.backup 


备份 某 个 database 中 所 有 名 称 以 “pay” 开 头 的 表 ， 备 份 结果 以 压缩 
格式 输出 : 


pg_dump -h localhost -p 5432 -U someuser -F CC -b -v -t *.pay* -f pay.b 


备份 某 个 database 中 hr 和 payroll 这 两 个 schema 中 的 所 有 数 
据 ， 备 份 结果 以 压缩 格式 输出 : 


pg_dump -h localhost -p 5432 -U someuser -Fc -b -v \ 
-Nn hr -n payroll -f hr.backup mydb 





备份 某 个 database 中 除了 public schema 中 的 数据 以 外 的 所 有 数 
据 ， 备 份 结果 以 压缩 格式 输出 : 


pg_dump -h localhost -p 5432 -U someuser -F C -b -v -N public \ 
-f all_sch except pub.backup mydb 











将 数据 备份 为 SQL 文本 文件 ， 且 生成 的 INSERT 语句 是 带 有 字段 名 


列表 的 标准 格式 ， 该 文件 可 用 于 将 数据 导入 到 低 于 当前 版 本 的 
PostgreSQL 或 者 其 他 支持 SQL 的 非 PostgreSQL 数据 库 中 (之 所 以 
能 够 实现 这 种 数据 移植 过 程 ， 是 因为 标准 的 SQL 文本 可 在 任何 文 
持 SQL 标准 的 数据 库 中 执行 ) : 





pg_dump -h localhost -p 5432 -U someuser -F p --column-inserts \ 
-f select tables.backup mydb 








外 如 条 输出 文件 路 径 中 含 空 格 或 者 其 他 可 能 影响 命令 行 正 


瞩 


第 处 理 的 字符 ， 请 在 路 径 两 侧 加 上 双 引 号 ， 比 如 : "/path 
with spaces/mydb.backup" 。 请 注意 ， 这 在 PostgreSQL 中 
是 一 个 通用 的 原则 ， 即 当 你 不 确定 某 段 文本 是 否 能 正常 处 理 
时 ， 都 可 以 加 双 引 号 。 


从 PostgreSQL 9.1 版 开始 文 持 目录 格式 。 使 用 该 格式 会 将 每 个 表 备 
份 为 菜 个 文件 夹 下 的 一 个 单独 的 文件 ， 这 样 就 解决 了 以 其 他 备份 格 
式 备 份 时 可 能 存在 的 单个 文件 大 小 超出 操作 系统 限制 的 问 

题 。pg_dump 工具 所 文 持 的 各 种 备份 格式 中 ， 只 有 使 用 目录 格式 时 
会 生成 多 个 文件 ， 具 体 语法 参见 示例 2-10。 备 份 时 会 完 创建 一 个 新 
目录 ， 然 后 为 每 个 表 生 成 一 个 gzip 格式 的 压缩 文件 ， 另 外 目录 下 

还 会 生成 一 个 描述 所 有 备份 对 象 之 间 层 级 关系 的 文件 。 如 果 备 份 开 
始 时 发 现 指定 的 目录 已 存在 ， 那 么 该 命令 会 报错 并 退出 。 


示例 2-10 ”目录 格式 备份 


pg_dump -h localhost -p 5432 -U someuser -F d -f /somepath/a directory 


从 9.3 版 开始 文 持 并 行 备 份 选 项 : --jobs 或 -j] ， 后 面 设置 并 行 度 
数值 。 例 如 将 其 设 定 为 --jobs=3 (-j 3 ) ， 则 后 台 会 有 三 个 线 
程 并 行 执行 当前 备份 任务 。 此 选项 只 有 在 按 目 录 格 式 进行 备份 时 才 
会 生效 ， 因 为 前 面 已 经 提 到 过 ， 只 有 选择 目录 格式 时 才能 并 行 生成 
多 个 备份 文件 。 每 个 写 线程 只 负责 写 一 个 单独 的 文件 ， 因 此 一 定 古 
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示例 2-11 目录 格式 并 行 备份 


pg_dump -h localhost -p 5432 -U someuser -j 3 -Fd -f /somepath/a direc 


2.7.2 ”使 用 pg dumpal1l 进行 全 局 备份 


pg_dumpall 工具 可 以 将 当前 PostgreSQL 服务 实例 中 所 有 database 
的 数据 都 导出 为 SQL 文本 《〈 请 注意 : pg_dumpall 不 支持 导出 


SQL 文本 以 外 的 其 他 格式 ) 。 可 以 看 出 ， 这 是 一 种 便于 理解 的 明文 
备份 格式 ， 备 份 结果 也 包含 了 表 空 间 定 义 和 角 色 等 全 局 对 象 。 要 了 
解 该 命令 文 持 的 所 有 选项 ， 请 参考 附录 B.2 市 。 

建议 你 每 天 都 对 角色 和 表 空 间 定义 等 全 局 对 象 进行 备份 ， 但 不 建议 
每 天 都 使 用 pg_dumpall 来 备份 所 有 database 的 数据 ， 使 用 
pg_dump 来 分 别 备 份 每 个 database 或 者 使 用 pg_basebackup 来 备 
份 整个 PostgreSQL 实例 的 全 部 数据 是 更 好 的 选择 。pg_dumpall 仪 
文 持 导出 为 SQL 文本 格式 ， 而 使 用 这 种 庞大 的 SQL 文本 备份 来 进 
行 全 库 级 别 的 数据 恢复 是 极其 耗 时 的 。 将 pg_basebackup 与 流 复 
制 机 制 连用 是 实现 PostgreSQL 系统 高 可 用 的 最 快 方法 。 

以 下 命令 可 实现 仅 备 份 角 色 和 表 空 间 定义 等 全 局 对 象 : 


pg_dumpall -h localhost -U postgres --port=5432 -f myglobals.sql --glo 


如 果 仅 需 备 份 角色 定义 而 无 须 备份 表 空 间 ， 那 么 使 用 如 下 命令 : 


pg_dumpall -h localhost -U postgres --port=5432 -f myroles.sql --roles 


2.7.3 ”数据 恢复 


PostgreSQL 可 以 使 用 以 下 两 种 方法 来 恢复 pg_dump 和 
pg_dumpall 备份 的 数据 : 


。 使 用 psql 来 恢复 pg_dump 或 者 pg_dumpall 工具 生成 的 SQL 
文本 格式 的 数据 备份 ; 


。 使 用 pg_restore 工具 来 恢复 由 pg_dump 工具 生成 的 压缩 格 
式 、TAR 包 格 式 或 者 目录 格式 备份 。 


。 使 用 psqgl 恢 复 SQL 文 本 格式 的 数据 备份 


所 谓 的 SQL 文本 格式 的 数据 备份 其 实 就 是 一 个 包含 SQL 脚本 
的 文本 文件 。 这 种 备份 格式 使 用 起 来 最 不 方便 ， 却 是 最 通用 的 


一 种 。 恢 复 时 需要 将 此 SQL 脚本 全 部 执行 一 过 。 你 无 法 选择 
性 地 仅 恢复 部 分 数据 ， 除 非 你 手工 编辑 此 文件 。 以 下 示例 都 是 
An 过 程 中 可 能 需要 在 psql 界面 上 输 


恢复 一 个 SQL 备份 文件 并 忽略 过 程 中 可 能 发 生 的 所 有 错误 : 


psql -U postgres -f myglobals.sql 


恢复 一 个 SQL 备份 文件 ， 如 遇 任 何 错误 则 立即 俘 止 恢复 : 


psql -U postgres --set ON_ERROR_STOP=on -f myglobals.sql 


将 SQL 文本 中 的 数据 恢复 到 茶 个 指定 的 database: 


psql -U postgres -d mydb -f select objects.sql 


。 使 用 pg_restore 进行 恢复 


如 果 你 是 使 用 pg_dump 进行 的 备份 ， 并 且 选 择 的 输出 格式 为 
TAR、 压 缩 格 式 或 者 目录 格式 ， 输 出 结果 都 是 二 进 制 文件 ， 那 
么 必须 使 用 pg_restore 工具 来 进行 恢复 。pg_restore 文 持 
的 选项 之 多 令 人 眼花 综 乱 ， 远 远 超 过 我 们 所 使 用 过 的 其 他 任何 
数据 库 中 提供 的 恢复 工具 。 以 下 介绍 一 些 该 工具 的 特别 功能 。 


o 支持 并 行 恢复 ， 使 用 -j (或 者 是 效果 相同 的 --jobs= ) 
选项 可 以 指定 并 行 恢复 的 线程 数 。 多 个 恢复 线程 可 以 并 行 

每 个 线程 处 理 一 张 表 。 该 模式 可 以 显著 提高 恢复 速 

o 你 可 以 使 用 pg_restore 扫描 备份 文件 来 生成 一 张 备 份 内 
容 列 表 ， 通 过 该 列表 可 以 确认 备份 中 包含 了 哪些 内 容 。 你 
还 可 以 通过 编辑 该 内 容 列 表 来 控制 恢复 哪些 内 容 。 

o pg_restore 支持 选择 性 地 仅 备 份 部 分 对 象 以 节省 备份 时 











间 ， 不 管 是 针对 整个 database 的 备份 还 是 针对 部 分 对 象 的 
备份 ， 都 可 以 使 用 该 特性 。 如 果 你 仅 需 恢复 单 张 表 ， 那 么 
可 以 用 这 个 方法 。 

o pg_restore 的 大 部 分 功能 是 后 癌 兼 容 的 ， 即 文 持 将 老 版 
本 PostgreSQL 生成 的 备份 数据 恢复 到 新 版 本 的 
PostgreSQL 中 。 


各 想 了 解 pg_restore 命令 所 支持 的 全 部 选项 ， 请 参考 附录 
B.3 节 。 


pg_restore 执行 恢复 动作 之 前 ， 请 先 创 建 目标 数据 


CREATE DATABASE mydb ; 


然后 执行 恢复 : 











pg_restore --dbname=mydb --jobs=4 --verbose mydb.backup 





如 果 备 份 和 恢复 时 使 用 的 database 同名 ， 则 可 以 通过 加 -- 
create 选项 省 去 单独 建 库 的 过 程 ， 命 令 如 下 : 


pg_restore --dbname=postgres --create --jobs=4 --verbose mydb .bac 





如 果 指 定 了 --create 选项 ， 那 么 恢复 出 来 的 数据 库 名 就 会 默 
认 采 用 备份 时 的 数据 库 名 ， 不 允许 改名 。 如 果 还 同时 指定 了 - 
-dbname 选项 ， 那 么 此 时 连接 的 数据 库 名 一 定 不 能 是 待 恢复 的 





数据 库 名 ， 因 为 恢复 数据 库 之 前 必然 要 建 数 据 库 ， 而 建 数 据 库 
之 前 必然 要 先 连 到 某 个 已 存在 的 数据 库 ，--dbname 选项 指定 
的 就 是 建立 被 恢复 的 数据 库 之 前 先 连 到 哪个 数据 库 ， 所 以 必然 
不 能 与 待 恢复 的 数据 库 重 名 ， 我 们 一 般 指定 为 先 连 到 
postgres 数据 库 。 





正常 情况 下 ， 数 据 恢 复 时 不 会 重建 目标 database 中 已 经 存在 的 
对 象 。 如 果 你 的 目标 database 和 其 中 的 各 类 对 象 均 已 存在 ， 并 
且 还 有 一 些 数 据 在 里 面 ， 你 只 是 想 用 备份 中 的 数据 来 奉 代 现 有 
database 中 的 数据 ， 那 么 执行 pg_resotre 时 使 用 - -clean 选 
项 即 可 达到 目标 。 该 选项 的 效果 是 先 把 目标 database 中 的 对 象 
删除 反 ， 然 后 在 恢复 过 程 中 一 一 重建 。 








俯 、 如 果 针 对 现存 的 一 个 database 执行 恢复 ， 其 内 容 会 
被 备份 文件 中 的 内 容 替 代 。 因 此 这 种 情况 下 需要 特别 注 
意 : 和 干 万 不要 选 错 了 备份 文件 或 者 指定 了 错误 的 目标 


database。 


9.2 版 或 更 新 版 本 的 pg_restore 文 持 --section 选项 ， 加 上 
该 选项 后 可 以 实现 仅 恢 复 表 结构 而 不 恢复 表 数 据 。 当 希望 创建 
模板 数据 库 时 可 以 用 这 个 方法 ， 因 为 模板 数据 库 一 般 不 需要 带 
数据 。 具 体 做 法 是 先 创建 目 标 数据 库 : 


CREATE DATABASE mydb2; 


然后 使 用 pg_restore : 





pg_restore --dbname=mydb2 --section=pre-data --jobs=4 mydb.backup 





01. 2.8 ”基于 表 空 间 机 制 进行 存 储 管理 


PostgreSQL 使 用 “ 表 空 间 ” 这 一 概念 来 将 逻辑 存储 空间 映射 到 磁盘 上 
的 物理 存储 空间 。 


PostgreSQL 在 安装 阶段 会 自动 生成 两 个 表 空 间 : 一 个 是 
pg_default ， 用 于 存储 所 有 的 用 户 级 数据 ， 男 一 个 是 pg_global 
， 用 于 存储 所 有 的 系统 级 数据 。 这 两 个 表 空 间 就 位 于 默认 的 数据 文 
件 夹 下 。 你 可 以 不 受 限 地 创建 表 空 间 并 将 其 物理 存储 位 置 设 定 到 任 
何 一 块 物理 磁盘 上 。 你 也 可 以 为 database 设 定 默认 表 空 间 ， 这 样 该 
database 中 创建 的 任何 新 对 象 都 会 存储 到 此 表 空 间 上 。 你 也 可 以 将 
现存 的 数据 库 对 象 迁移 到 新 的 表 空 间 中 。 


2.8.1 表 空 间 的 创建 
创建 表 空 间 需 要 先 为 其 取 一 个 逻辑 名 称 并 指定 某 个 物理 文件 夹 作 为 
其 存储 位 置 ， 注 意 要 确保 postgres 操作 系统 账户 对 此 文件 夹 有 完 


全 的 访问 权限 。 如 果 你 目前 使 用 的 是 Windows 服务 器 ， 请 使 用 如 
下 命令 行 ( 注 意 使 用 Unix 风格 的 斜 杠 作 为 路 径 分 隔 符 ) : 


CREATE TABLESPACE secondary LOCATION 'C:/pgdata94 secondary'; 


对 于 基于 Unix 的 系统 来 说 ， 必 须 先 创建 文件 夹 或 者 定义 一 个 fstab 
位 置 ， 然 后 执行 以 下 命令 : 


CREATE TABLESPACE secondary LOCATION '/usr/data/pgdata94 secondary  ; 


2.8.2 ”在 表 空 间 之 间 迁 移 对 象 


你 可 以 将 数据 库 中 的 对 象 在 表 空 间 之 间 随 意 迁 移 。 如 果 和 希望 将 一 个 
database 的 所 有 对 象 都 移动 到 另 一 个 表 空 间 中 ， 可 以 执行 以 下 命 
Ev 


























ALTER DATABASE mydb SET TABLESPACE secondary; 


如 采 只 而 望 移动 一 张 表 ， 命 令 如 下 : 


ALTER TABLE mytable SET TABLESPACE secondary; 


PostgreSQL 9.4 中 引入 了 一 个 新 功能 : 一 次 性 把 一 个 表 空 间 的 多 个 
对 象 迁 移 到 男 一 个 表 空 间 。 如 果 命 令 执行 者 是 超级 用 户 ， 那 么 源 表 
| 所 有 的 对 象 都 会 被 迁移 过 去 ;否则 仅 会 迁移 执行 者 所 拥有 的 对 


将 pg_default 默认 表 空 间 中 的 所 有 对 象 迁移 到 secondary 表 空 
间 ， 所 需 的 命令 行 如 下 : 


ALTER TABLESPACE pg default MOVE ALL TO secondary; 


在 迁移 过 程 中 所 涉及 的 database 和 表 会 被 锁定 。 


01. 2.9 ”禁止 的 行为 


我 们 作为 第 一 见证 人 见证 并 处 理 过 很 多 PostgreSQL 故障 ， 因 此 在 
本 章 的 最 后 一 节 中 ， 我 们 认为 有 必要 逐条 列 出 那些 最 常见 的 错误 。 


对 于 初学 者 来 说 ， 如 果 你 搞 不 清 a 到 底 哪 里 出 了 问题 ， 那 么 请 首先 查 
看 系统 日 志 ， 从 中 可 以 找到 解决 问题 的 线索 。 日 志文 件 位 于 数据 文 
件 夹 的 根 目录 或 者 其 中 的 pg_log 子 文件 夹 下 。 也 有 可 能 系统 在 记 
下 日 志 之 前 即 已 衣 尝 ， 那 么 显然 这 种 情况 下 会 日 志 是 没 用 的 。 如 果 
你 的 PostgreSQL 服务 局 动 失 败 ， 请 答 试 执行 以 下 操作 系统 命令 。 


path/to/your/bin/pg_ctl -D your postgresql data folder 


2.9.1 切记 不 要 删除 PostgreSQL 系 统 文件 


你 可 能 党 得 这 是 废话 ， 但 当 破 盘 空 间 不 够 的 时 候 有 些 人 束 会 民 手 民 
脚 地 从 PostgreSQL 的 数据 文件 夹 下 删除 文件 ， 因 为 它 占 用 的 空间 

实在 是 太 大 了 。 出 现 这 种 问题 的 部 分 原因 是 有 些 文件 夹 的 名 称 的 确 
很 容易 令 人 误解 ， 比 如 : pg_log、pg_xlog 和 pg_clog。 这 里 面 的 确 
有 些 文件 是 可 以 安全 删除 的 ， 但 你 需要 准确 地 知道 哪些 能 删 哪些 不 
能 删 ， 人 否则 很 容易 导致 数据 库 被 破坏 。 


pg& log 文件 夹 一 般 在 data 文件 夹 下 ， 其 体积 可 能 增长 得 很 快 ， 无 其 
古 当 打 开 了 日 志 开 关 的 时 候 。 这 个 文件 夹 下 的 文件 任何 时 候 都 可 以 
I 事实 上 很 多 人 会 设置 一 个 定时 任务 来 定期 清除 这 些 日 志 
文件 。 


除了 pg_xlog 文件 夹 下 的 文件 可 以 有 条 件 地 删除 外 ， 其 他 
PostgreSQL 系统 文件 夹 中 的 文件 都 不 能 删 ， 即 使 有 的 文件 夹 名 称 中 
这 有 log 字样 因而 看 起 来 像 是 茶 种 日 志 ， 也 绝对 不 能 删 ， 比 如 
pg_clog 文件 夹 中 存储 的 是 活跃 事务 提交 日 志 ， 除 非 你 想 删 库 跑 

路 ， 人 否则 千 万 不 要 碰 。 


pg_xlog 文件 夹 用 于 存储 事务 日 志 。 我 们 见 过 有 的 系统 中 会 在 
































pg_xlog 文件 夹 下 建 一 个 子 文件 夹 archive， 专 门 用 于 存放 归档 的 事 
务 日 志 。 一 般 来 说 ， 你 的 系统 总 会 需要 创建 一 个 专门 的 文件 夹 (该 
文件 夹 不 一 定 要 放 在 pg_xlog 下 ) 用 于 日 志 归 档 ， 因 为 如 果 这 是 一 
个 同步 复制 环境 ， 那 么 需要 持续 地 进行 事务 日 志 归 档 需要 归档 文 
件 夹 的 另 一 个 理由 是 得 把 这 些 日 志 存 下 来 以 备 不 时 之 需 ， 因 为 我 们 
有 可 能 需要 将 系统 数据 恢复 到 过 去 的 某 个 时 间 点 。 将 pg_xlog 文件 
夹 下 的 所 有 文件 都 删除 会 导致 PostgreSQL 后 台 进程 衣 沽 。 但 仅 删 
除 归 档 文件 夹 下 的 日 志 却 没 这 么 严重 ， 最 多 会 导致 无 法 恢复 到 过 去 
的 某 个 时 点 ， 或 者 是 在 同步 环境 下 可 能 导致 从 属 服务 器 无 法 进行 数 
据 同 步 ， 因 为 还 未 来 得 及 同步 的 一 些 日 志文 件 可 能 已 被 删 掉 了 。 如 
果 以 上 场景 在 你 的 系统 中 都 不 涉及 ， 那 么 可 以 放心 地 删除 归档 文件 
夹 下 的 日 志文 件 。 


要 当心 某 些 过 于 “尽责 ”的 杀毒 软件 ， 特 别 是 在 Windows 上 。 我 们 
曾经 遇 到 过 杀毒 软件 把 很 重要 的 PostgreSQL 可 执行 文件 给 删 掉 的 
案例 。 如 果 在 Windows 环境 下 发 现 PostgreSQL 无 法 启动 ， 记 得 首 
先 查 看 一 下 事件 查看 器 (event viewer) 的 记录 ， 其 中 可 能 存在 有 用 
的 线索 。 






































和 在 PostgreSQL 10 中 ，pg_xlog 目录 被 改名 为 pg_wal， 
pg_clog 被 改名 为 pg_xact， 以 防止 用 户 认为 这 些 目 录 中 放 的 都 
是 日 志 ， 想 删 就 删 而 不 会 造成 任何 后 果 。 


2.9.2 不 要 把 操作 系统 管理 员 权限 授予 PostgreSQL 的 
系统 账号 


很 多 人 可 能 会 误 认 为 postgres 这 个 操作 系统 账号 必须 拥有 操作 系 
统 的 管理 员 权 限 。 事 实 上 ， 在 有 的 PostgreSQL 版 本 上 ， 如 果 给 予 
postgres 账号 管理 员 权 限 ， 很 有 可 能 导致 该 操作 系统 启动 失 

败 。 














postgres 账 亏 应 该 就 是 一 个 普通 用 户 账号 ， 只 要 能 够 访问 data 文 
件 夹 以 及 其 他 表 空 间 文 件 夹 即 可 。 大 多 数 PostgreSQL 安装 包 会 自 
动 为 postgres 账号 设 定 够 用 的 权限 ， 请 不 要 画蛇添足 。 在 SQL 
注入 攻击 中 ， 那 些 不 必要 的 权限 会 为 攻击 者 们 提供 可 乘 之 机 。 


有 些 情况 下 ， 的 确 是 有 必要 把 data 文件 夹 以 外 的 某 些 文件 夹 或 者 可 





执行 程序 的 “改写 /删除 / 读 取 ”权限 授予 postgres 账号。 比如 ， 
当 需 要 设置 一 个 定时 任务 来 执行 批 处 理 任 务 或 者 访问 文件 型 FDW 
时 就 需要 这 么 干 。 针 对 这 种 情况 ， 我 们 也 建议 你 仅仅 授予 
postgres 账号 最 小 的 必要 权限 ， 而 不 应 该 为 了 图 省 事 而 直接 授予 
其 最 高 权限 。 


2.9.3 ”不 要 把 shared_buffers 绥 存 区 设置 得 过 大 


禁止 将 shared_buffers 设置 得 和 系统 当前 内 存 总 容量 一 样 大 ， 人 否 
则 很 可 能 会 导致 操作 系统 骨 尝 或 者 是 启动 失败 。 在 32 位 Windows 
系统 上 ， 该 设置 如 果 超 过 512MB 就 可 能 导致 系统 出 问题 。 在 64 位 
Windows 上 ， 该 限制 可 以 放宽 到 1GB 或 者 更 大 一 些 也 没 问题 。 在 
有 些 Linux 系统 上 ， 不 能 将 shared_buffers 设置 得 大 于 SHMMAX 
变量 ， 而 一 般 来 说 SHMMAX 的 值 是 比较 小 的 ， 所 以 这 就 给 
shared_buffers 的 设置 带 来 了 一 些 限制 。 


PostgreSQL 9.3 修改 了 内 核对 于 内 存 的 使 用 方法 ， 因 此 之 前 版 本 中 
那些 因 内 核 限 制 而 导致 的 问题 从 该 版 本 开始 不 复 存 在 。 官 方 手册 
中 “内 核资 源 管理 ”一 节 介 绍 了 更 多 关于 这 方面 的 细节 。 


2.9.4 ”不 要 将 PostgreSQL 服 务 器 的 侦 昕 端口 设 为 一 个 已 
被 其 他 程序 占用 的 端口 


如 果 启 动 PostgreSQL 时 系统 发 现 侦 听 端口 已 被 占用 ， 那 么 会 在 
pg log 中 记录 类 似 这 样 的 错误 日 志 : make sure PostgreSQL is 
not already running 。 以 下 是 可 能 导致 访问 题 的 常见 原因 。 


postgres 服务 实例 已 经 启动 好 了 ， 而 你 正 试图 再 启动 一 过 。 
PostgreSQL 服务 侦 听 端口 已 被 其 他 程序 占用 。 

postgres 服务 之 前 发 生 过 异常 关闭 或 者 骨 沉 ， 在 data 文件 夹 
下 遗留 了 一 个 postgresql.pid 文件 。 请 直接 删除 该 文件 并 再 次 尝 
试 启动 。 

有 一 个 孤立 的 PostgreSQL 进程 还 在 运行 。 如 果 前 述 方法 都 试 
过 了 但 问题 仍 未 解决 ， 请 终止 所 有 还 在 运行 的 PostgreSQL 进 
程 ， 然 后 再 次 尝试 启动 。 






































01. 


第 3 章 psql 工 具 


psql 是 PostgreSQL 目 带 的 一 个 不 可 或 缺 的 命令 行 工具 ， 用 途 广 

泛 ， 除 了 执行 SQL 这 个 基本 功能 外 ， 还 可 用 于 执行 脚本 、 导 入 导 

出 数据 、 恢 复 表 数据 以 及 执行 其 他 数据 库 管 理 任务 ， 它 其 至 还 可 以 
作为 一 个 简单 的 报表 生成 器 来 使 用 。 如 果 你 只 能 以 无 图 形 界 面 的 命 
令 行 方式 访问 数据 库 服务 器 ， 那 么 psql 就 是 你 访问 PostgreSQL 的 

唯一 选择 。 如 果 你 符合 前 述 情况 ， 那 么 你 就 得 熟悉 psql 的 众多 命令 
和 选项 。 在 学 习 本 章 时 ， 建 议 你 将 附录 B.4 节 中 提供 的 psql 帮助 信 
恩 打 印 出 来 ， 放 在 手边 以 备查 阅 。 





01. 3.1 环境 变量 


在 设置 PGHOST 、PGPORT 和 PGUSER 等 环境 变量 后 ， 在 调用 psql 
命令 行 时 就 不 用 显 式 地 指定 主机 、 端 口 和 用 户 了 ， 系 统 会 自动 使 用 
环境 变量 设 定 的 值 ， 这 一 点 跟 PostgreSQL 自 带 的 其 他 命令 行 工具 
是 一 样 的 。 为 避免 每 次 登录 时 都 输入 密码 ， 你 也 可 以 用 
PGPASSWORD 这 个 环境 变量 来 设置 登录 密码 。 如 果 和 希望 以 更 安全 的 
方式 处 理 登 录 密 码 ， 请 使 用 密码 文件 ， 相 关内 容 请 参见 官方 手册 
中 “密码 文件 ”一 节 的 介绍 。 从 PostgreSQL 9.2 版 开始 ，psql 支持 以 
下 两 个 新 的 环境 变量 。 


PSQL_HISTORY 


该 变量 用 于 设置 psql 历史 日 志文 件 名 ， 该 日 志 中 记录 了 近期 通 
过 psql 执行 过 的 所 有 命令 行 ， 其 默认 值 为 ~/.psql_history。 


PSQLRC 

该 变量 用 于 设置 用 户 自 定 义 的 配置 文件 的 路 径 和 文件 名 。 你 可 
以 自行 决定 是 否 使 用 该 特性 。 用 户 可 以 将 常用 的 设置 项 统一 集中 存 
放 到 自 定义 配置 文件 里 ， 然 后 psql 启动 时 会 先 读 取 这 个 文件 再 加 载 
默认 配置 ， 这 个 文件 中 的 配置 会 覆盖 默认 配置 。 


如 果 你 既 未 设 定 相应 的 环境 变量 ， 也 未 在 命令 行 中 指定 相关 参数 ， 
那么 psql 会 使 用 系统 默认 值 。 














和 如 果 你 使 用 pgAdmin3 工具 连接 到 了 某 个 database， 那 么 
可 以 通过 其 工具 栏 上 的 “插件 ” 羔 单 项 来 直接 打开 psql， 这 个 新 
打开 的 psql 使 用 的 参数 就 是 pgAdmin 配置 的 参数 。 








01. 3.2 ”psgl 的 两 种 操作 模式 : 交互 模式 与 非 交 互 
模式 


直接 在 操作 系统 的 命令 行 界面 上 键入 psql 并 按 回 车 ， 从 操作 系统 
提示 符 切换 到 psql 提示 符 后 就 表示 已 经 进入 了 psql 的 交互 模式 界 
面 。 你 现在 就 可 以 执行 命令 了 。 对 于 SQL 语句 来 说 ， 记 得 要 输入 
分 写作 为 命令 结束 标记 ， 要 是 不 输入 残 下 接 按 回 车 的 话 ，psql 会 认 
为 命令 还 未 输入 完成 ， 会 在 换行 后 等 待 继续 输入 。 


在 psql 界面 上 键入 \? 会 列 出 交互 模式 下 支持 的 所 有 命令 。 为 了 方 
便 读者 ， 我 们 将 这 些 命令 列表 放 在 了 附录 B 中 ， 并 高 涡 显 示 最 新 版 
本 中 添加 的 条 目 ， 具 体 请 参见 附录 B.4 市 。 如 果 在 psql 界面 上 键入 
\h ， 后 跟 命 令 关 键 字 ， 则 会 打印 出 该 命令 在 PostgreSQL 官方 手册 
中 相应 的 语法 帮助 信息 。 


如 果 和 希望 顺序 执行 一 系列 命令 ， 我 们 建议 把 这 些 命 令 写 成 一 个 脚本 
文件 ， 然 后 使 用 psql 以 非 交 互 模式 执行 该 脚本 。 在 操作 系统 的 命令 
提示 符 下 输入 psql 后 带 脚本 文件 名 即 可 执行 该 脚本 。 脚 本 中 可 以 
含有 任意 数量 的 SQL 和 psql 命令 。 除 执行 脚本 外 ， 非 交互 模式 还 
支持 直接 执行 一 条 或 多 条 SQL 语句 ， 不 过 语句 两 侧 需 要 加 上 双 引 
号 。 可 以 看 出 ， 该 模式 特别 适用 于 需要 执行 自动 化 任务 的 场景 。 只 
需 将 任务 内 容 写 入 脚本 文件 ， 然 后 用 某 种 定时 任务 工具 来 设置 好 定 
时 执行 即 可 。 和 定时 任务 工具 可 以 采用 pgAgent， 在 Linux/Unix 下 可 
以 使 用 crontab ， 在 Windows 下 可 以 使 用 定时 任务 规划 器 。 


由 于 非 交 互 模式 下 绝 大 多 数 操作 馆 辑 都 由 脚本 实现 ， 因 此 命令 行 需 
要 提供 的 选项 很 少 。 如 需 了 解 非 交 互 模式 下 psql 的 选项 ， 请 参考 附 
录 B.5 太 。 要 在 非 交 互 模式 下 执行 脚本 文件 ， 只 需 使 用 -f 选项 即 
可 


psql -f some script file 


要 在 非 交互 模式 下 执行 SQL 语句 ， 只 需 使 用 -c 选项 即 可 。 如 采 要 
一 次 执行 多 个 语句 ， 语 句 之 间 请 用 分 号 分 隅 : 


























psql -d postgresql book -c "DROP TABLE IF EXISTS dross; CREATE SCHEMA 


在 脚本 中 也 可 以 使 用 交互 式 命 令 。 示 例 3-1 是 一 个 名 为 
build_stage.psql 的 脚本 的 内 容 ， 其 中 会 创建 一 张 名 为 
staging.factfinder_import 的 表 ， 该 表 后 续 会 在 示例 3-10 中 
用 到 。 脚 本 中 先生 成 了 一 个 CREATE TABLE 命令 ， 然 后 将 这 个 命令 
写 入 了 create_script.sql 文件 ， 最 后 执行 了 刚刚 生成 的 
create_script.sq] 文件 。 


示例 3-1 和 带 psgql 交互 式 命令 的 脚本 


Ng create script.sql 
SELECT 
“CREATE TABLE staging.factfinder import ( 
geo_id varchar(255), geo_ id2 varchar(255), geo _ display varchar 
array_to _ string(array agg('s' || 
lpad(i::text,2,'6') || ' varchar(255),s' || 
lpad(i::text,2,'6') || '_perc varchar(255)'),',') || 


je 
FROM generate series(1,51) As i; 
\o © 
\i create script.sql © 








@ 我 们 希望 该 脚本 执行 后 输出 的 结果 是 能 直接 运行 的 SQL 语句 ， 
因此 需要 用 \t (或 者 --tuples-only ) 选项 来 忽略 标题 栏 的 输 
出 ， 同 时 使 用 \a 选项 关闭 对 齐 模式 以 防止 psql 为 对 齐 输出 结果 而 
自动 加 上 换行 符 。 使 用 \g 让 所 有 查询 内 容 都 输出 到 指定 文件 。 


@ 使 用 不 市 参数 的 \o 命令 来 停止 查询 结果 重 定 向 到 外 部 文件 。 


@ 使 用 \i 加 脚本 名 create_script.sql 来 执行 生成 的 脚本 。\i 的 效 
果 等 同 于 非 交 互 模式 下 的 -f 选项 。 


要 执行 示例 3-1， 在 操作 系统 命令 行 界面 下 输入 以 下 命令 行 即 可 : 





psql -f build stage.psql -d postgresql book 


示例 3-1 中 借鉴 了 “How to Create an N-column Table” 这 篇 博文 中 所 
介绍 的 方法 来 创建 表 。 这 访 文 章 中 介绍 的 方法 无 须 借 助 中 间 文 件 ， 
ed 了 从 PostgreSQL 9.0 版 开始 支持 的 DO 命令 来 执行 自动 化 
建 表 。 





01. 3.3 ”定制 psql 操 作 环 境 


如 果 你 的 工作 需要 整 天 与 psql 打交道 ， 那 么 可 以 对 psql 操作 环境 
进行 定制 以 使 其 更 好 地 符合 自己 的 使 用 习惯 。psql 在 启动 阶段 会 搜 
索 一 个 名 为 psqlrc 的 配置 文件 ， 如 果 找 到 则 会 顺序 执行 其 中 的 配置 
动作 ， 这 些 配置 决定 了 psql 的 一 些 行为 模式 。 


在 Linux/Unix 环境 中 ， 该 文件 一 般 会 被 命名 为 .psqlrc 并 放置 在 
postgres 用 户 的 home 目录 下 。 在 Windows 上 ， 该 文件 叫 作 
psqlrc.conf 并 被 放置 于 %APPDATA%\postgresq] 文件 夹 下 ， 一 般 来 
说 就 是 c:\Users\username\AppData\Roaming\postgresql 文件 夹 。 
PostgreSQL 安装 完成 后 找 不 到 此 文件 是 正常 的 ， 因 为 该 文件 一 般 需 
手动 创建 。 该 文件 中 的 设置 项 会 履 盖 psql 的 默认 值 。 如 需 了 解 更 多 
人 请 参见 官方 手册 中 “psql 参考 手册 ”一 节 的 
容 。 


示例 3-2 中 展示 了 psqlrc 文件 的 内 容 ， 你 可 以 在 其 中 添加 任何 psql 
命令 以 在 启动 时 执行 。 


示例 3-2 ”psqlrc 文件 内 容 








\pset null "NULL 

\encoding latin1 

\set PROMPT1 '%n@%M:%>%X %/# "' 
\pset pager always 

\timing on 

\set qstats92 


SELECT usename, datname, left(query,1606) || ''...'' As query 
FROM pg stat activity WHERE state != ''idle'' ; 








外 psqlrc 文件 中 set 命令 后 跟 的 操作 内 容 不 允许 分 为 多 行 
书写 。 上 文 显 示 为 两 行 仅 仅 是 因为 该 语句 较 长 导致 印刷 时 放 不 
下 ， 所 以 必须 分 成 两 行 。 








局 动 psqdl 时 ， 屏 幕 上 会 显示 该 文件 中 内 容 被 执行 后 的 输出 结 


Null display is "NULL". 
Timing is on. 

Pager is always used. 
psql (9.6beta3) 


Type "help" for help. 
postgres@localhost:5442 postgresql book# 





有 的 psql 设置 命令 仅 适 用 于 Linux/Unix 环境 而 不 适用 于 Windows 
环境 ， 反 之 亦 然 。 但 不 管 在 什么 操作 系统 环境 下 ， 在 指定 路 径 时 都 
应 使 用 Linux/Unix 风格 的 正和 斜 村 (/ ) ， 其 目的 是 为 了 区 别 于 指定 
选项 时 所 用 的 反 斜 枉 〈\ ) 。 如 果 和 希望 psql 启动 时 跳 过 加 载 psqlrc 
文件 这 一 步骤 ， 使 用 默认 参数 ， 请 添加 -X 选项 。 


你 可 以 在 psql 运行 时 动态 修改 参数 ， 但 必须 关闭 psql 再 打开 才能 
生效 。 如 果 要 删除 某 个 psql 配置 变量 或 者 希望 将 其 设置 回 默认 值 ， 
可 以 使 用 \unset 命令 ， 后 跟 变 量 名 称 ， 比 如 : \unset qstat92 














请 注意 : 使 用 set 命令 时 设置 的 变量 名 是 区 分 大 小 写 的 。 系 统 变量 
请 使 用 大 写 ， 用 户 自 定义 变量 请 使 用 小 写 。 在 示例 3-2 

中 ，PROMPT1 是 一 个 系统 变量 ， 用 于 指定 psql 终端 界面 上 的 提示 
符 ， 而 qstat92 是 一 个 自 定 义 变量 ， 作 用 是 提供 一 个 查询 
PostgreSQL 服务 器 上 当前 活跃 连接 的 快捷 方式 。 





3.3.1 自 定 义 psqgl 界 面 提 示 符 


如 果 你 工作 时 需要 使 用 psql 在 多 台 不 同 的 数据 库 服务 器 或 者 多 个 不 
同 的 database 间 切 换 ， 那 么 定制 不 同 的 提示 符 是 很 有 必要 的 。 定 制 
后 的 psql 界面 提示 符 可 以 告诉 你 当前 连接 的 是 哪 全 服务 咒 上 的 哪个 
database， 从 而 避免 误 操作 的 发 生 。 下 面 是 设置 带 有 很 多 信息 的 提 
示 符 的 一 种 简单 方式 : 














\set PROMPT1 '%n@%M:%>%X %/# " 





其 中 包括 了 几 个 元 素 : 登录 角色 (%n ) 、 主 机 名 〈%M ) 、 侦 听 端 
口 (%> ) 、 事 务 状态 〈%x ) 以 及 当前 使 用 的 database 名 (%/ ) 。 
这 种 写法 可 能 详细 过 头 了 ， 你 可 以 按 需 裁剪 一 下 。 提 示 符 所 文 持 的 
完整 符号 列表 可 从 官方 手册 的 “psql 参考 手册 ”一 节 中 找到 。 


连接 到 数据 库 后 ， 提 示 符 看 起 来 会 像 下 面 这 样 : 


postgres@localhost:5442 postgresql book# 


执行 \connect postgis_book 切换 目标 数据 库 后 ， 提 示 符 会 变 成 
下 面 这 样 : 


postgres@localhost:5442 postgis book# 


3.3.2 语句 执行 时 间 统 计 
有 了 时候 我 们 可 能 会 需要 psql 打印 出 执行 每 个 语句 所 消耗 的 时 间 。 可 
通过 \timing 命令 来 打开 或 者 关闭 执行 时 间 统 计 开 关 。 


打开 执行 时 间 统 计 开 关 时 ， 每 个 查询 执行 完毕 的 输出 结果 中 都 会 附 
带 执 行 时 长 。 例 如 ， 使 用 \timing on 命令 执行 SELECT 
COUNT(*) FROM pg _tables 后 ， 输 出 如 下 : 























Time: 18.656 ms 





3.3.3 ”事务 自动 提交 


默认 情况 下 ， 目 动 提 交 功 能 是 处 于 局 用 状态 的 ， 也 就 是 说 任何 一 个 
SQL 语句 执行 完毕 后 ， 它 所 做 的 数据 修改 都 会 被 立即 提交 ， 这 种 情 


况 下 每 个 语句 都 是 一 个 独立 的 事务 ， 一 旦 执行 完毕 其 结果 束 不 可 撤 
销 。 如 果 你 需要 运行 大 量 的 DML 语句 并 且 这 些 语句 还 未 经 充分 测 
试 ， 那 么 自动 提交 功能 会 市 来 大 扶 烦 ， 此 时 有 必要 关闭 事务 自动 提 
交 机 制 来 保护 数据 。 


请 先 关闭 自动 提交 功能 : \set AUTOCOMMIT off 。 然 后 就 可 以 按 
需 对 事务 进行 回 深 了 : 


UPDATE census .facts SET short name = 'This is a mistake.'; 


要 回 深 事 务 ， 请 执行 : 


ROLLBACK; 























全 、 在 非 自 动 提 交 模 式 下 请 一 定 要 记得 在 最 后 提交 事务 ， 否 
则 未 提交 的 事务 会 在 退出 psql 时 自动 回 深 掉 。 
3.3.4 ”命令 别名 


你 可 以 使 用 \set 来 为 某 个 命令 创建 别名 ， 我 们 建议 你 将 全 局 性 的 
别名 写 到 psqlrc 文件 中 。 人 例如， 如果 你 每 十 分 钟 就 要 执行 一 次 
EXPLAIN ANALYZE VERBOSE ， 那 么 每 次 完全 重 输 一 裔 会 很 烦人 ， 
可 以 为 它 起 一 个 别名 。 


\set eav “EXPLAIN ANALYZE VERBOSE 








这 样 在 任何 需要 用 到 EXPLAIN ANALYZE VERBOSE 命令 的 地 方 ， 都 
可 键入 :eav 蔡 代 前面 的 冒号 表示 这 是 一 个 需要 展开 的 命令 变 


量 ) 。 


:eav SELECT COUNT(*) FROM pg tables; 


你 甚至 可 以 为 一 个 完整 的 查询 语句 起 个 别名 并 存 入 psqlrc 文件 中 ， 
如 同 我 们 在 示例 3-2 中 所 做 的 一 样 。 建 议 别名 使 用 小 写字 母 ， 以 避 
免 与 大 写 的 系统 环境 变量 冲突 。 


3.3.5 “取出 前 面 执行 过 的 命令 行 


跟 许 多 命令 行 工 具 一 样 ， 你 在 psql 中 也 可 以 用 向 上 方向 键 快速 找 出 
之 前 执行 过 的 历史 命令 。HISTSIZE 环境 变量 决定 了 系统 存储 的 历 

史 命 令 行 的 数量 。 例 如 : \set HISTSIZE 16 会 将 可 追溯 的 历史 命 
令 数 量 设 定 为 最 多 10 条 。 

如 果 你 正在 编写 一 个 非常 复杂 的 查询 语句 或 者 执行 一 系列 很 关键 的 


更 新 操作 ， 那 么 可 能 会 需要 将 这 些 语句 存 入 指定 的 文件 中 以 备 后 续 
查看 ， 可 以 使 用 HISTFILE 环境 变量 来 实现 此 功能 。 


\set HISTFILE ~/.psql history - :DBNAME 


入 Windows 环境 下 不 文 持 保存 历史 命令 ， 除 非 是 使 用 
Cygwin、MingW 或 者 MSYS 来 模拟 Unix 环境 。 


























01. 3.4 psql 使 用 技巧 
本 节 将 介绍 一 些 被 漂 没 在 大 量 的 psql 文档 中 的 特殊 技巧 。 
3.4.1 执行 shell 命 令 
psql 中 通过 \! 可 以 直接 执行 操作 系统 命令 。 比 如 你 使 用 的 是 


Windows 环境 ， 需 要 列 出 当前 工作 目录 的 内 容 ， 那 么 不 需要 退出 
psql 环境 ， 只 需 直 接 在 psql 界面 上 执行 \! dir 即 可 。 











3.4.2 ”用 watch 命令 重复 执行 语句 


\watch 命令 是 PostgreSQL 9.3 中 为 psql 引入 的 一 项 新 功能 。 它 可 
以 实现 以 固定 的 频率 反复 执行 某 个 语句 ， 以 便 持 续 观 察 其 输出 。 例 
如 你 需要 持续 监控 系统 中 当前 正在 执行 的 所 有 语句 的 情况 ， 那 么 只 
需 把 watch 语句 加 到 查询 语句 的 后 面 即 可 ， 如 示例 3-3 所 示 。 


示例 3-3 10 秒 钟 得 询 一 次 所 有 数据 库 连 接 上 的 活跃 负载 





SELECT datname，query 
FROM pg _stat_activity 
WHERE state = 'active' AND pid != pg backend pid(); 


Nwatch 16 

















虽然 设计 \watch 命令 的 本 意 是 用 于 反复 执行 监控 类 查询 语句 以 便 
于 持续 观察 系统 状态 ， 但 你 也 可 以 将 其 用 于 重复 执行 其 他 指定 的 语 
句 ，watch 命令 并 不 关心 语句 本 身 的 内 容 是 什么 。 

在 示例 3-4 中 ， 我 们 先 使 用 批量 加 载 方 法 创建 了 一 张 表 ， 然 后 每 5 
秒 记 录 一 次 系统 负载 信息 。 注 意 后 面 只 有 跟着 \watch 的 第 二 句 话 
才 会 被 每 5 秒 执行 一 次 。 


示例 3-4 5 秒 记 录 一 次 系统 负载 情况 


SELECT * INTO log activity 





FROM pg_stat activity; © 
INSERT INTO log activity 
SELECT * FROM pg stat activity; \watch 5 @ 





@ 以 pg_stat activity 为 模板 新 建 一 张 结构 和 数据 都 完全 相同 
的 log_activity 表 。 


@ 每 5 秒 重 复 一 次 将 pg_stat_activity 最 新 数据 导入 
log_activity 的 动作 。 


如 果 需 要 终止 watch 进程 ， 请 执行 CTRL-X 加 CTRL-C。 








3.4.3 ”显示 对 象 信息 


有 多 条 psql 命令 都 能 用 于 显示 数据 库 对 象 列 表 ， 并 附带 给 出 每 个 对 
象 的 详细 信息 。 示 例 3-5 展示 了 如 何 列 出 pg_catalog 中 以 pg_t 
打头 的 所 有 表 的 信息 ， 同 时 附带 这 些 表 所 占 空 间 的 大 小 。 


示例 3-5 ”使 用 \dt+ 命令 列 出 表 信 息 


\dt+ pg catalog.pg 七 * 


| 

+ 
pg_catalog | pg tablespace postgres 
pg_catalog | pg trigger postgres 
pg_catalog | pg ts config postgres 
pg_catalog | pg ts config map postgres 
pg_catalog | 
pg_catalog | 
pg_catalog | 
pg_catalog | 


pg_ts_dict postgres 
pg_ts_parser postgres 
pg_ts template postgres 
pg_type postgres 








如 果 需 要 查询 某 个 特定 对 象 的 详细 信息 ， 可 以 使 用 \d+ 命令 ， 如 示 
例 3-6 所 示 。 


示例 3-6 ”通过 \d+ 命令 得 到 对 象 的 详细 信息 


\d+ pg ts dict 


Table "pg catalog.pg ts dict" 
Column | Type | Modifiers 


dictname 

dictnamespace 

dictowner 

dicttemplate 

dictinitoption 

Indexes: 

"pg ts dict dictname index" UNIQUE, btree (dictname, dictnamespace) 
"pg ts dict oid index" UNIQUE, btree (oid) 

Has OIDs: yes 





3.4.4” 行 转 列 视图 


PostgreSQL 9.6 中 psql 新 增 支 持 了 \crosstabview 命令 ， 这 一 特 
性 极 大 地 降低 了 视图 行 转 列 的 难度 。 该 命令 可 以 为 用 户 节 约 很 多 时 
间 ， 但 只 能 在 psql 命令 行 环境 下 使 用 。 示 例 3-7 演示 了 如 何 使 用 这 
一 特性 ， 后 面 也 会 给 出 详细 的 说 明 。 


示例 3-7 行 转 列 视图 





SELECT student, subject, AVG(score)::numeric(5,2) As avg_score 
FROM test_ scores 

GROUP BY student, subject 

ORDER BY student, subject 

\crosstabview student subject avg score 


student | algebra | calculus | chemistry | physics | scheme 


regina 
sonia 
(4 rows) 





\crosstabview 命令 应 紧 跟 在 你 希望 实现 行 转 列 的 SQL 语句 后 





面 。\crosstabview 命令 的 输入 是 前 面 SQL 语句 中 查询 的 三 个 字 
段 ， 后 面 还 可 以 跟 一 个 可 选 的 排序 字段 。 该 命令 实现 的 效果 是 对 原 
生 查 询 结 果 进 行 行 转 列 后 重 排 .第 一 个 字段 是 一 行 的 标记 ， 第 二 个 
字段 被 翻转 为 列 ， 第 三 个 字段 按照 第 一 个 和 第 二 个 字段 的 每 种 排列 
组 合作 为 值 出 现 。 执 行 \crosstabview 命令 时 也 可 以 不 输入 字段 
名 ， 这 就 要 求 前 面 的 SQL 查询 语句 中 只 能 查询 三 个 字段 ， 命 令 默 
认 就 会 去 取 这 三 个 字段 作为 入 参 。 


在 示例 3-7 中 ，student 是 行 的 标记 字段 ，subject 是 行 转 列 后 铺 
开 的 字段 ，avg_score 会 在 前 两 个 字段 排列 组 合 而 成 的 每 个 交叉 点 
处 作为 值 出 现 。 如 果 碍 询 结果 中 某 个 特定 的 student-subject 组 合 不 
存在 ， 则 其 值 为 空 。 我 们 可 以 在 \crosstabview 命令 的 入 参 中 显 
式 输入 字段 名 ， 但 当 SQL 本 身 的 查询 字段 列表 就 是 我 们 想 要 的 列 
表 时 ， 我 们 可 以 不 输入 。 








3.4.5 ”执行 动态 SQL 


有 时 我 们 会 需要 根据 某 个 查询 的 结果 动态 构造 出 SQL 语句 ， 然 后 
执行 它 。 在 PostgreSQL 9.6 之 前 的 版 本 中 ， 需 要 先 构造 出 SQL， 然 
后 将 其 输出 到 外 部 脚本 文件 ， 再 执行 脚本 文件 。 当 然 ， 你 也 可 以 选 
择 使 用 D0 语法 ， 但 对 于 长 SQL 语句 来 说 用 起 来 很 不 方便 。 从 
PostgreSQL 9.6 开始 ， 你 可 以 选择 使 用 \gexec 命令 来 执行 动态 生 
成 的 SQL， 其 特点 是 生成 SQL 和 执行 SQL 在 同一 步骤 中 完成 ， 非 
常 方便 。 该 命令 会 遍历 查询 输出 结果 中 的 每 一 行 并 执行 其 中 的 SQL 
语句 。 人 遍历 顺序 是 外 层 按 记录 行 迭 代 ， 内 层 按 字 上 段 迭 代 。gexec 命 
令 还 没有 支持 识别 每 行 记 录 中 的 每 个 字段 是 否 都 是 一 个 SQL， 目前 
仅 支 持 每 行 是 一 个 SQL 的 情况 。 另 外 ，gexec 仅仅 机 械 地 遍历 执 
行 所 有 SQL， 并 不 关心 每 个 SQL 的 执行 结果 ， 即 使 中 途 有 SQL 执 
行 出 错 ，gexec 依然 会 继续 人 氨 历 执行 下 去 ， 但 它 在 遍历 查找 SQL 
的 过 程 中 会 识别 出 null 记录 并 跳 过 。 示 例 3-8 中 创建 了 两 张 表 并 使 
用 \gexec 实现 了 往 每 张 表 中 插入 一 条 记录 。 


示例 3-8 ”使 用 gexec 创建 表 并 插入 数据 

















SELECT 


'CREATE TABLE ' || person.name || '( a integer, b integer)' As cre 
'INSERT INTO ' || person.name || ' VALUES(1,2) ' AS insert 
FROM (VALUES ('leo'),('regina')) AS person (name) \gexec 


CREATE TABLE 
INSERT 6 1 
CREATE TABLE 
INSERT 6 1 





在 示例 3-9 中 ， 我 们 使 用 gexec 来 查询 information_schema 中 
的 表 ， 获 取 元 数据 。 





示例 3-9 ”使 用 gexec 获取 每 张 表 中 的 记录 数 


SELECT 


'SELECT ' || quote literal(table name) || ' AS table name, 


COUNT(*) As count FROM ' || quote ident(table name) AS cnt dq 
FROM information schema.tables 


WHERE table name IN ('leo','regina') \gexec 


table name | count 


regina 
(1 row) 





01. 3.5 ”使 用 psql 实 现 数据 的 导入 和 导出 


psql 文 持 一 个 叫 作 \copy 的 命令 ， 该 命令 可 以 将 数据 导出 到 文本 文 
件 中 ， 也 可 以 从 文本 文件 中 导入 数据 。 文 本 文件 中 默认 使 用 制 表 符 
作为 分 隔 符 ， 当 然 你 也 可 以 指定 使 用 其 他 分 隅 符 。 文 本 中 必须 使 用 
换行 符 来 分 隔 不 同 的 行 ， 人 否则 无 法 正确 区 分 两 行 记 录 。 我 们 采用 美 
国人 口 普 碍 数据 网 站 上 提供 的 马 陡 诸 帮 州 人 口 统计 数据 来 作为 我 们 
的 第 一 个 例子 。 你 可 以 从 链接 
http://www.postgresonline.com/downloads/postgresql_book_2e.zip 中 
下 载 我 们 接 下 来 要 用 到 的 DEC_10_SF1_QTH1 with_ann.csy 文件 。 


3.5.1 ”使 用 psql 进 行 数据 导入 


需要 导入 非 规 范 化 数据 或 者 需要 导入 我 们 不 太 了 解 其 特征 的 数据 

时 ， 我 们 一 般 建议 这 么 做 : 首先 ， 新 建 一 个 独立 的 schema 来 作为 
数据 过 渡 区 ， 将 新 数据 导入 此 schema 中 ; 然后 ， 通 过 一 些 查 询 来 
摸 清 这 些 数据 的 特性 ， 最 后 才 把 这 些 数 据 分 门 别 类 导入 到 正式 的 产 
品 表 中 ， 并 删除 之 前 建立 的 过 渡 区 schema。 


在 将 数据 导入 PostgreSQL 之 前 ， 需 要 先 建立 一 张 表 来 容纳 新 数 

据 ， 而 且 表 的 列 数 和 数据 类 型 必须 与 待 导入 的 数据 一 致 。 如 果 一 个 
待 导入 的 文本 文件 的 内 部 列 和 记录 结构 清晰 有 序 ， 那 么 这 个 建 表 步 
又 理论 上 是 可 以 省 略 的 ， 因 为 psql 可 以 上 自动 判断 每 个 列 的 类 型 并 上 自 
动 把 表 建 好 ， 但 为 了 避免 出 现 psql 目 动 判断 数据 类 型 出 错 的 情况 ， 
这 个 步骤 最 好 不 要 省 略 。psql 把 整个 导入 过 程 当成 一 个 完整 的 事务 
来 处 理 ， 因 此 如 果 导 入 数据 时 遇 到 任何 错误 ， 那 么 整个 导入 动作 所 
做 的 修改 会 完全 回 滚 掉 。 如 果 你 对 源 文件 中 数据 的 特点 并 不 完全 了 
解 ， 我 们 建议 你 用 最 宽松 的 条 件 来 创建 容纳 表 ， 等 数据 导入 之 后 再 
对 数据 进行 细 化 加 工 。 例 如 ， 如 果 你 不 确定 某 一 列 是 否 全 都 是 数 
字 ， 那 么 可 以 将 该 列 的 数据 类 型 设置 为 character varying ， 等 
数据 导入 之 后 再 执行 检查 ， 稍 后 再 进行 转换 。 


示例 3-10 会 癌 我 们 在 示例 3-1 中 创建 的 表 中 导入 数据 。 打 开 psql 
并 执行 示例 3-10 中 的 命令 。 


示例 3-10 ”使 用 psql 导入 数据 























\connect postgresql book 
\cd /postgresql book/che3 


\copy staging.factfinder import FROM DEC 108 SF1 QTH1 with ann.csv CSV 





在 上 面 的 示例 中 ， 我 们 在 psql 的 交互 模式 下 执行 了 导入 过 程 : 首先 
连接 数据 库 ， 然 后 使 用 \cd 切换 到 含有 数据 源 文件 的 目录 ， 最 后 执 
行 \copy 导入 动作 。 因 为 \copy 命令 支持 的 默认 分 隔 符 是 制 表 

符 ， 所 以 我 们 必须 在 命令 行 中 额外 指明 源 文件 是 用 逗号 作为 分 隔 符 
的 CSV 格式 。 


如 果 源 文件 使 用 了 一 些 非 标准 的 分 隔 符 ， 比 如 竖 杠 〈| ) ， 那 么 也 
请 在 命令 中 以 如 下 方式 指明 : 


\copy sometable FROM somefile.txt DELIMITER '|'; 


如 果 和 希望 把 文本 中 的 空 值 奉 换 为 你 指定 的 内 容 再 导入 ， 可 以 用 
NULL AS 来 标记 要 替换 的 内 容 : 


\copy sometable FROM somefile.txt NULL As ''; 


全 、 请 不 要 将 psql 中 的 \copy 命令 与 SQL 语言 提供 的 
COPY 语句 相 泥 淆 。psgl 是 一 个 客户 端 工 具 ， 所 有 路 径 都 是 相 
对 于 已 连接 客户 端 进行 解释 的 。 而 SQL copy 是 基于 服务 器 
的 ， 并 在 postgres 服务 操作 系统 账户 的 环境 下 运行 。 因 此 输 
入 文件 必须 驻 留 在 可 由 postgres 服务 账户 访问 的 路 径 中 。 


3.5.2 ”使 用 psql 进 行 数据 导出 


psdl 的 数据 导出 功能 比 导入 功能 更 简单 、 更 灵活 ， 你 甚至 可 以 指定 
仅 导 出 某 张 表 的 茶 一 部 分 记录 。 导 出 时 使 用 的 依然 是 psql 的 \copy 
命令 。 在 示例 3-11 中 ， 我 们 将 演示 如 何 将 前 面 刚刚 导入 库 中 的 数 

据 再 导 回 到 以 制 表 符 为 分 卫 符 的 文本 中 。 




















示例 3-11 使 用 psql 导出 数据 


\connect postgresql_ book 
\copy (SELECT * FROM staging.factfinder import WHERE S61 ~ E'^[6-9]+' 
TO “/test .tab 


WITH DELIMITER E'\t' CSV HEADER 





默认 情况 下 psql 导出 数据 时 会 使 用 tab 键 作 为 分 隔 符 。 然 而 ， 以 这 

种 格式 导出 时 默认 不 导出 标题 行 。 你 可 以 通过 指定 HEADER 选项 来 

要 求 导出 标题 行 ， 请 注意 该 选项 仅 当 输出 格式 为 CSV 时 才 可 使 用 
(参见 示例 3-12) 。 


示例 3-12 ”使 用 psql 导出 数据 








\connect postgresql_ book 
\copy staging.factfinder import TO '/test.csyv' 


WITH CSV HEADER QUOTE '"' FORCE QUOTE * 





FORCE QUOTE * 表示 输出 的 所 有 列 的 前 后 郊 将 加 上 引用 符 ， SGN 
引用 符 上 默认 就 是 双 引 写 ， 但 为 清晰 起 见 ， 我 们 还 是 显 式 指定 了 -- 
站 


3.5.3 ”从 外 部 程序 复制 数据 以 及 将 数据 复制 到 外 部 程序 
从 PostgreSQL 9.3 版 开始 ， 开始 支持 从 全 命令 行程 序 的 输出 中 获 
取 数 据 并 将 数据 村 储 到 表 中 ， 这 类 命 命令 行 程序 包括 curl1、ls 和 
wget 等 。 示 例 3-13 演示 了 如 何 使 用 dir 命令 将 一 个 目录 下 的 文件 
列表 导入 表 中 


示例 3-13 ”使 用 psql 导入 茶 个 目录 下 的 文件 列表 


\connect postgresql_ book 
CREATE TABLE dir list (filename text); 


\copy dir list FROM PROGRAM ‘dir C:\projects /b' 





Hubert Lubaczewski 在 博文 "Piping copy to/from an external 
program” 中 介绍 了 更 多 关于 使 用 \copy 命令 的 例子 。 


01. 3.6 ”使 用 psql 制 作 简 单 的 报表 


你 也 许 会 觉得 难以 置信 ， 但 psdql 的 确 能 够 制作 简单 的 HIML 报 
表 。 请 执行 以 下 命令 并 查看 生成 的 HIML 报表 ， 它 应 该 类 似 图 3-1 
所 展示 的 样子 。 


psql -d postgresql book -H -c" 

SELECT category, count(*) As num per_cat 
FROM pg settings 

WHERE category LIKE ‘'%Query%" 


GROUP BY category 
ORDER BY category; 
" -0 test.html 





category num per cat 
Query Tuning / Genetic Query Optimizer 7 
Query Tuning / Other Planner Options 5 
Query Tuning / Planner Cost Constants 6 
Query Tuning / Planner Method Configuration 11 
Statistics / Query and Index Statistics Collector 6 


(S rows) 
图 3-1: 简单 的 HTML 报表 


上 面 的 报表 看 起 来 还 算 竣 合 ， 但 这 仪 仪 是 输出 了 一 个 HTML 表 

格 ， 还 称 不 上 是 一 个 完全 符合 格式 要 求 的 HIML 文档 。 为 了 让 该 
让 一 些 ， 我 们 需要 写 一 个 脚本 来 作为 辅助 ， 内 容 见 
不 例 3-14。 








示例 3-14 编写 settings_report.psq] 文件 来 设置 报表 内 容 





\o settings report.html © 

\T 'cellspacing=6 cellpadding=6' @ 

\qecho '<html><head><style>H2{color:maroon}</style>' © 
N\qecho '<title>PostgreSQL Settings</title></head><body>' 


N\qecho '<table><tr valign=''top''><td><h2>Planner Settings</h2>" 

\x on 个 

\t on®@ 

\pset format html © 

SELECT category, 

string agg(name || '=' || setting, E'\n' ORDER BY name) As settings @ 
FROM pg_ settings 

WHERE category LIKE '%Planner%' 

GROUP BY category 

ORDER BY category; 

\H 

N\qecho “</td><td><h2>File Locations</h2>' 

\x off © 

\t on 

\pset format html 

SELECT name, setting FROM pg _ settings WHERE category = 'File Locations 
ORDER BY name; 

N\qecho '<h2>Memory Settings</h2>" 

SELECT name, setting, unit FROM pg_ settings WHERE category ILIKE “%mem 
ORDER BY name; 

\qecho '</td></tr></table>' 

\qecho '</body></html>" 

NO 





@ 指定 查询 结果 输出 到 一 个 文件 中 。 
@ HIML 表格 的 输出 格式 设置 。 
@ 添加 一 些 附 加 的 HIML 代码 。 


@@ 打开 记录 输出 的 展开 模式 。 重 复 每 一 个 记录 的 列 标题 ， 并 将 每 
一 个 记录 的 每 一 列 作为 一 个 单独 的 记录 输出 。 


@ 强制 查询 的 结果 输出 为 一 个 HTML 表格 。 


@ string_agg() 是 PostgreSQL 9.0 中 引入 的 一 个 函数 ， 可 以 将 聚 
合 运 算 中 被 划 为 同 组 的 字符 串 值 合并 为 单个 字符 串 。 


@ 关闭 记录 输出 的 展开 模式 ， 这 样 第 二 个 和 第 三 个 查询 结果 在 报 
表 上 的 输出 格式 应 该 是 每 条 记录 仅 占 一 行 。 











人 @ 设置 “是 否 仅 输出 记录 ”开关 。 如 果 此 开关 是 开启 的 ， 则 会 忽略 列 


标题 和 行 计数 。 


示例 3-14 演示 了 通过 灵活 使 用 SQL 和 psql 命令 可 以 创建 出 一 个 内 
容 丰 宇 的 综合 性 分 层 报表 。 要 运行 示例 3-14 中 的 脚本 有 两 种 方 

法 : 可 以 使 用 psql 以 交互 方式 连接 并 执行 \i 
settings_report.psql ， 也 可 以 在 操作 系统 的 命令 行 界面 上 运 
行 psql -f settings_report.psql 。settings_report.html 生成 的 


输出 结果 如 图 3-2 所 示 。 
Planner Settings 


category|Query Tuning / Other Planner Options 
settings constraint exclusion=partition 
cursor tuple fraction=0.1 

default statistics_target=100 

from collapse limit=8 

join collapse limit=8 








category Query Tuning / Planner Cost Constants 





|settings jcpu_ index tuple cost=0.005 
cpu_operator cost=0.0025 
cpu_tuple_cost=0.01 
effective_cache size=16384 
random page cost=4 

seq page cost=1 








icategory Query Tuning / Planner Method 
IConfiguration 

| settings enable_bitmapscan=on 

enable_ hashage=on 

enable_ hashjoin=on 

enable indexonlyscan=on 
enable indexscan=on 





~ tat 


图 3-2: 复杂 的 HTML 报表 


如 上 所 示 ， 通 过 构造 psql 脚本 可 以 实现 将 多 个 查询 的 输出 结 


File Locations 


config file Ci/projects/pg/pe92edb/data/posteresql.conf 
data directory |C:/projects/pg/p292edb/data 

lexternal pid file| 

hba file Ic :/projects/pg/pg92edb/data/pg_hba.conf 
ident file IC:-/projects/pg/pg92edby/data/pg_ ident.conf 


Memory Settings 





rraintenance_work_menm [16384B 


max prepared transactions0 





Imax stack depth 2048 kB 
lshared_buffers 4096 |8kB 
temp_buffers 1024 |8kB 


track_activity_query_size |1024 | 
Iwork mem 11024 kB 











整合 


到 一 个 报表 中 。 另 外 ， 你 还 可 以 通过 pgAgent、crontab 或 者 





Windows 定时 任务 管理 器 等 工具 定时 执行 脚本 。 


01. 


第 4 半 pgAdmin 的 使 用 


pgAdmin4 是 一 款 PostgreSQL 图 形 化 管理 工具 ， 其 可 靠 性 和 实用 性 
已 久 经 考验 ， 目 前 最 新 版 本 是 V1.6。 相 较 其 前 任 pgAdmin3， 
pgAdmin4 经 过 了 彻底 的 改写 。pgAdmin3 所 支持 的 一 些 特性 还 没有 
移植 到 pgAdmin4， 但 将 来 都 会 移植 过 来 。 本 章 将 聚焦 于 pgAdmin4 
的 现 有 功能 。pgAdmin4 的 大 部 分 功能 在 pgAdmin3 中 也 都 有 ， 
此 本 章 内 容 对 于 pgAdmin3 用 户 也 有 价值 。 本 章 还 会 介绍 一 些 在 
pgAdmin3 中 运用 广泛 但 尚未 移植 到 pgAdmin4 的 特性 。 后 续 我 们 
将 统一 使 用 pgAdmin 来 称呼 这 两 个 版 本 ， 仅 当 二 者 在 功能 上 有 差 
异 时 才 会 加 上 版 本 号 。 











A 到 目前 为 止 ，pgAdmin4 相对 于 pgAdmin3 的 主要 变化 包 
括 : 对 于 较 新 的 PostgreSQL 9.6 和 PostgreSQL 10 支持 较 好 ; 
文 持 以 浏览 器 或 昌 面 应 用 两 种 模式 运行 ， 文 持 在 查询 结果 窗 格 
中 直接 对 记录 进行 编辑 ， 支持 同时 选中 查询 结果 窗 格 中 的 非 邻 
接 项 ， 性 能 方面 的 提升 。 如 果 你 在 Windows 平台 上 工作 ， 请 
一 定 要 使 用 pgAdmin4 的 V1.6 或 者 更 高 的 版 本 ，V1.6 之 前 的 
版 本 在 Windows 下 以 更 面 模式 运行 时 存在 性 能 问题 。 


虽然 pgAdmin 有 其 缺点 ， 但 开发 组 对 bug 的 修复 一 直 都 很 及 时 ， 
而 且 也 在 不 停 地 为 其 添加 新 的 功能 特性 。 因 为 PostgreSQL 社区 的 
开发 者 们 将 其 定位 为 使 用 最 广泛 的 PostgreSQL 图 形 化 管理 工具 ， 
并 且 在 很 多 PostgreSQL 发 行 包 中 都 会 附带 ， 所 以 开发 者 们 一 直 确 
保 它 与 最 新 版 本 的 PostgreSQL 保持 同步 更 新 。 如 果 新 版 本 的 
PostgreSQL 中 引入 了 一 个 新 特性 ， 那 么 最 新 版 本 的 pgAdmin 一 定 
会 文 持 对 此 特性 进行 管理 。 如 果 你 是 PostgreSQL 新 手 ， 那 么 选择 
pgAdmin 作为 入 门 工 具 肯 定 没 错 。 











01. 4.1 pgAdmin 入 门 


很 多 PostgreSQL 发 行 包 中 都 附带 有 pgAdmin4。BigSQL 和 EDB 的 
PostgreSQL 发 行 包 自 从 9.6 版 之 后 就 包含 了 pgAdmin4 作为 一 个 可 
选 安装 项 。 如 果 你 需要 使 用 pgAdmin3 工具 来 管理 PostgreSQL 9.6 
之 后 的 版 本 ， 可 以 使 用 BigSQL 提供 的 pgAdmin3 LTS， 该 版 本 已 
经 针对 PostgreSQL 9.6 和 PostgreSQL 10 做 了 适 配 更 新 。 用 BigSQL 
公司 的 包 管理 器 工具 可 以 安装 pgAdmin3 LTS。 从 PostgreSQL 9.5 
起 ，EDB 公司 的 发 行 包 中 就 只 包含 pgAdmin4 了 。pgAdmin 开发 组 
也 不 会 再 对 pgAdmin3 做 任何 的 功能 增强 。 


如 果 只 需 安 装 pgAdmin 而 无 须 安 北 PostgreSQL 本 号 ， 你 可 以 从 
pgAdmin 的 官网 下 载 pgAdmin 的 安装 包 。 该 网 站 还 提供 了 
pgAdmin 的 使 用 手册 ， 你 可 以 仔细 研读 一 下 。 该 工具 的 功能 设计 清 
晰 有 序 ， 而 且 大 部 分 功能 是 自 解释 的 ， 也 就 是 说 你 仅 赁 摸索 而 无 须 
专门 指导 即 可 了 解 其 使 用 方法 。 对 于 那些 爱 “ 尝 鲜 * 的 用 户 来 说 ， 可 
OE 
并 反馈 bug。 


4.1.1 功能 概览 


下 面 会 先 列 出 我 们 认为 最 精华 的 部 分 功能 ， 不 过 这 只 是 小 试 牛刀 ， 
更 多 内 容 请 参见 pgAdmin 官网 上 的 功能 介绍 页 面 。 


同时 支持 服务 器 模式 和 桌面 应 用 模式 

pgAdmin4 同时 文 持 以 桌面 模式 和 服务 器 模式 安装 ， 前 者 是 以 
本 地 应 用 的 方式 运行 ， 后 者 是 一 个 基于 WSGI 规范 的 Web 应 用 ， 
可 以 通过 浏览 器 访问 。pgAdmin3 仅 支 持 桌 面 模式 。 
执行 计划 的 图 形 化 解释 功能 

该 功能 非常 有 用 ， 它 能 够 以 图 形 化 方式 展示 执行 计划 。 当 然 原 


来 那 种 见长 的 文本 形式 的 执行 计划 也 会 继续 存在 ， 但 图 形 化 方式 展 
示 的 执行 计划 会 让 用 户 对 整个 执行 计划 了 解 得 更 加 深入 和 全 面 。 














SQL 执行 面板 


不 管 在 界面 上 执行 什么 样 的 操作 ，pgAdmin 最 终 都 要 通过 SQL 
语句 来 与 PostgreSQL 服务 端 进行 交互 ， 系 统 允 许 你 得 看 这 种 确 层 
SQL。 当 你 使 用 图 形 化 界面 对 数据 库 服务 器 进行 操作 时 ，pgAdmin 
会 目 动 在 SQL 结果 窗 格 中 展示 这 些 自动 生成 的 SQL 语句 。 对 于 新 
手 来 说 ， 研 究 这 种 上 自动 生成 的 SQL 是 极 好 的 学 习 途 径 。 对 专家 来 
说 ， 好 好 利用 这 种 自动 生成 的 SQL 可 以 节省 大 量 时 间 。 


postgresql.conf 和 pg_hba.conf 等 配置 文件 的 图 形 化 编辑 器 


你 不 再 需要 四 处 寻找 配置 文件 的 位 置 并 使 用 文本 编辑 器 来 修改 
它们 ， 在 pgAdmin 上 可 以 一 站 式 搞 定 。 该 功能 当前 仅 在 pgAdmin3 
中 文 持 ， 而 且 使 用 该 功能 需要 预先 在 postgres database 中 安装 名 
为 pgadmin 的 扩展 包 。 


数据 导入 和 导出 


pgAdmin 能 够 轻易 地 将 语句 查询 结果 导出 为 CSV 文件 或 者 基 
于 其 他 分 隔 符 的 文本 文件 ， 当 然 也 可 以 将 这 类 文件 导入 到 数据 库 
中 。pgAdmin3 甚至 文 持 将 表 数 据 导 出 为 HTML 格式 ， 因 此 可 以 当 
作 一 个 简易 的 一 键 式 报 表 服 务 器 来 用 。 


备份 与 恢复 问 导 


如 果 你 记 不 住 pg_restore 和 pg_dump 命令 的 大 量 选项 ， 没 
关系 ，pgAdmin 提供 了 一 个 很 友好 的 图 形 化 界面 来 帮 你 设 定 这 些 选 
项 ， 通 过 调整 这 些 选 项 可 以 实现 对 database、schema、 单 张 表 以 及 
全 局 对 象 进 行 定 制 化 的 备份 或 者 恢复 。 你 可 以 在 备份 恢复 界面 
的 “消息 ”选项 卡 上 看 到 系统 自动 生成 的 pg_dump 或 pg_restore 
命令 行 语 句 ， 如 果 你 觉得 有 必要 ， 完 全 可 以 把 这 些 语句 复制 下 来 作 
为 例句 使 用 。 


授权 向导 


该 功能 可 以 帮助 你 一 次 性 对 很 多 数据 库 对 象 进行 授权 或 者 解除 
授权 操作 ， 从 而 大 大 节省 你 的 时 间 。 

















pgScript 脚本 执行 引擎 


pgScript 是 一 种 速度 很 快 但 不 太 “ 正 规 * 的 脚本 执行 机 制 ， 该 机 
制 不 要 求 整 个 脚本 中 执行 的 所 有 操作 构成 一 个 事务 。 在 pgScript 
中 ， 你 可 以 在 一 个 循环 语句 的 每 一 次 循环 中 都 执行 一 次 提交 操作 ， 
如 末 是 在 函数 中 ， 那 么 只 能 是 所 有 循环 都 结束 后 才能 执行 提交 。 很 
遗憾 的 是 ， 这 种 灵活 的 机 制 只 能 在 pgAdmin3 中 使 用 (pgAdmin4 
还 不 文 持 ) 。 


SQL 编辑 右 的 目 动 补 全 功能 


用 CTRL 加 空格 键 可 以 激活 目 动 补 全 功能 ， 该 功能 在 
pgAdmin4 中 得 到 了 进一步 的 完善 。 


pgAgent 定时 任务 工具 


pgAgent 是 一 种 跨 平台 的 定时 任务 计划 工具 ， 后 续 将 使 用 一 整 
节 来 介绍 它 。pgAdmin 提供 了 一 套 很 完善 的 用 于 访问 pgAgent 的 接 
口 。 








4.1.2 ”如 何 连接 到 PostgreSQEL 服务 堪 


通过 pgAdmin 连接 到 PostgreSQL 服务 器 很 简单 ， 其 通用 
(General) 和 连接 〈Connection ) 选项 卡 如 图 4-1 所 示 。 


























图 4-1: pgAdmin4 注册 服务 器 连接 对 话 框 
4.1.3 pgAdmin 界 面 导航 


pgAdmin 界面 左 侧 的 树 状 目 录 布 局 看 起 来 很 直观 ， 但 由 于 它 直接 把 
所 有 底层 数据 库 对 象 呈现 给 了 有 用户， 所 以 可 能 让 人 至 无 头绪 。 你 可 
以 打开 Files -> Preferences 页 面 ， 点 开 左 侧 的 Nodes 页 面 ， 然 后 勾 
选 挥 你 不 希望 看 到 的 数据 库 对 象 类 型 ， 这 样 主页 面 上 显示 的 目录 树 
就 会 精简 很 多 。 可 以 通过 羔 单 栏 上 的 Files (文件 ) ~ 

Preferences (偏好 ) -Browser( 浏 览 器 ) -Nodes (显示 节点 ) 来 
打开 目录 树 定制 面板 。 你 将 看 到 如 图 4-2 所 示 的 界面 。 











Preferences 





BB Browser Casts Ey 从 
Display 
a Catalog Objects 区 到 
日 - Dashboard | 三 
多 Catalogs | Show | 了 
Graphs 
BH- Debugger Check Constraints ET 
Display 
i Collations 
HH- Miscellaneous show 
User language Columns EH 
BB Path 和 re 
onstraints 
Binary paths ED 
Help Databases EI 
BB SQL Edito' 
让 Domain Constraints ED 
Explain Domains Ei 
Options 
本 :Se Event Triggers | Show | 
Se Exclusion | Show | 


Constraints 
Extensions Ei 
FTS Configurations ET 


FTS Dictionaries [show | 


图 4-2: 在 pgAdmin4 的 树 状 浏览 目录 中 隐藏 或 者 显示 特定 类 型 的 
数据 库 对 象 


如 果 在 Browser ” Display 页 面 上 义 选 了 “在 树 状 目 录 中 显示 系统 对 
象 ?， 那 么 你 将 看 到 PostgreSQL 服务 器 的 内 部 对 象 ， 包 括 内 部 函 
数 、 系 统 表 、 表 的 隐藏 字段 等 。 你 还 将 看 到 PostgreSQL 系统 
schema 中 存储 的 元 数据 ， 包 括 information_schema 和 











pg_catalog 这 两 个 catalog 中 的 内 容 。 其 中 
information_schema 是 ANSI SQL 标准 中 规定 必须 要 有 的 ， 因 此 
在 别 的 数据 库 〈( 比 如 MySQL 和 SQL Server) 中 也 会 存在 。 你 可 能 
会 认 出 一 些 在 使 用 其 他 数据 库 产品 时 曾经 见 过 的 表 和 字段 。 


01. 4.2 pgAdmin 功 能 特性 介绍 


pgAdmin 工具 的 功能 丰富 而 强大 ， 本 书 的 篇 幅 不 足以 全 面 描述 ， 
此 我 们 仪 重点 介绍 一 些 比较 常用 的 功能 。 


4.2.1 根据 表 定 义 自 动 生 成 SQL 语句 
pgAdmin 有 一 个 基于 表 定 义 自 动 生成 SELECT 、INSERT 、UPDATE 


语句 模板 的 菜单 。 在 表 名 上 点 击 右键 ， 滚 动 到 其 中 的 Scripts 栏 ， 
即 可 找到 该 某 单 ， 界 面 如 图 4-3 所 示 。 














国 test_scores 
' Trigger Functions FF Create » 
Types DO Refresh... 


Views 兽 Delete/Drop 
iging 
oles 


兽 Drop Cascade 
lhl Reset Statistics 
5 更 Import/Export... 
££ Maintenance... | 
Scripts tf CREATE Script 
Truncate ”| % DELETE Script 
Backup... $$ INSERT Script 
十 Restore... SELECT Script 
到 View/Edit Data tf UPDATE Script 
5 Query Tool... T 】 
世 Properties. 


图 4-3: 表 脚 本 上 自动 生成 菜单 


其 中 的 “SELECT Script”* 项 特别 好 用 ， 它 一 点 开 束 会 自动 生成 一 个 包 
含 了 该 表 所 有 字段 的 碍 询 语句 。 如 果 表 有 很 多 字段 ， 而 你 义 需 要 得 
询 其 中 的 大 部 分 字段 ， 那 么 这 个 目 动 生成 的 语句 会 为 你 节省 很 多 时 
间 ， 只 需 把 你 不 想 要 的 字段 从 脚本 中 删除 即 可 。 











4.2.2 ”在 pgAdmin3 中 调用 psql 


尽管 pgAdmin 拥有 功能 强大 的 图 形 界 面 ， 但 有 些 时 候 还 是 离 不 开 
psql。 比 如 需要 执行 pg_dump 或 其 他 数据 转 储 工具 生成 的 体积 庞大 
的 SQL 文件 时 ，psql 就 更 合适 。 从 pgAdmin3 界面 很 容易 打开 psql 
工具 (请 注意 该 特性 仪 在 pgAdmin3 中 可 用 ，pgAdmin4 还 不 文 
持 ) ， 只 雷 点 击 “ 插 件 ” 菜 单 下 的 “PSQL Console” 项 即 可 ， 如 图 4-4 
所 示 。 这 样 就 会 局 动 一 个 psql 窗口 并 连接 到 当前 pgAdmin 环境 中 
己 连 接 的 database 上 ， 然 后 你 可 以 使 用 \cd 以 及 Ni 命令 来 改变 目 
录 并 执行 SQL 文件 。 








PSQL Console 





图 4-4: psql 插件 


请 注意 : 该 功能 需要 确保 针对 某 database 的 连接 已 建立 好 ， 因 此 只 
有 当 pgAdmin 已 连 上 PostgreSQL 服务 器 并 选中 某 个 database 
时 ,“ 插 件 ? 沫 单 下 的 “PSQL Console” 项 才 会 变 成 可 用 状态 。 


4.2.3 在 pgAdmin3 中 编辑 postgresql.conf 和 pg _hba.conf 
让 


只 要 服务 器 上 安装 了 adminpack 扩展 包 ， 那 么 你 就 可 以 在 
pgAdmin 界面 上 直接 编辑 配置 文件 。 一 般 来 说 ，PostgreSQL 的 一 键 
式 安装 包 都 会 自动 安装 好 adminpack 扩展 包 。 只 要 该 插件 已 安 

装 ， 你 就 可 以 看 到 Server Configuration 〈 服 务 器 配置 ) 菜单 已 启 
用 ， 如 图 4-5 所 示 。 









Server Configuration postgresql,conf 
pg_hba,conf 








Ronnow 








Serwer Status 
图 4-5: pgAdmin3 配置 文件 编辑 右 


如 果 你 的 pgAdmin 已 连接 到 PostgreSQL 服务 器 但 Server 
Configuration 荣 单 却 是 灰 的 ， 那 么 要 么 是 没 安 装 adminpack ， 要 
么 是 你 不 是 以 超级 用 户 身 份 登录 的 。 如 果 要 安装 adminpack ， 执 
行 CREATE EXTENSION adminpack 即 可 ， 或 者 也 可 以 通过 图 形 界 


面 来 安装 ， 如 图 4-6 所 示 。 安 装 好 以 后 请 断 开 与 服务 露 的 连接 并 重 
连 ， 然 后 束 可 以 看 到 琳 单 已 可 反击 。 


servers (2) In 
败 local 10 1 Create - Extension x 
日 同 Databases (4) 


日 - [器 postgres | General Definition SQL 





: 名 Casts | 
| | Name 
S Catalogs | 
i MG Event Triggers | | Select from the list 工 
| 局 嫩 Extensions (1) 
7 电 plpgsql | | | 
由 -已 Foreign Data Wrappd| dninpeck 
: J Languages | 
| | 日 - 银 schemas (4) | bloom | 
© pa temp_1 | | btree_gin 
由 © pg_toast | 
© py toast temp 1 | btree_gist 








put | dblink 国 

图 4-6: 使 用 pgAdmin4 安装 扩展 包 

4.2.4 创建 数据 库 对 象 并 设置 权限 

pgAdmin 允许 你 创建 各 种 数据 库 对 象 并 对 其 进行 权限 设置 。 

a. 创建 数据 库 以 及 其 他 数据 库 对 象 

利用 pgAdmin 创建 一 个 新 的 数据 库 非 营 简 单 ， 只 需 右键 单 击 
树 上 的 database 节点 并 选择 New Database 〈 新 建 数据 库 ) 即 
可 ， 如 图 4-7 所 示 。Definition 〈 定 义 ) 选项 卡 上 提供 了 一 个 下 


拉 沫 单 供 选 择 建 库 所 用 的 模板 数据 库 ， 我 们 在 2.4.1 节 中 介绍 
过 相关 内 容 。 


General ”Definition Security Parameters SQL 


Encoding UTF8 x 
Template Select from the list 

Tablespace Select from the list Y 
Collation Select from the list MM 
Character type | Select from the list MM 
Connection = 

limit 





| 3? 加 save | x cancel | 
图 4-7: 使 用 pgAdmin4 创建 新 数据 库 


创建 角色 、schema 和 其 他 数据 库 对 象 的 步骤 是 类 似 的 ， 都 有 
一 些 对 应 的 相关 页 面 供 你 设置 其 他 属性 。 


. 权限 管理 


在 PostgreSQL 数据 库 对 象 权 限 管 理 方面 ， 不 会 有 比 pgAdmin 
的 授权 癌 导 更 好 的 管理 工具 了 ， 你 可 以 通过 荣 单 栏 上 的 

Tools (工具 ) ~” Grant Wizard (授权 向 导 ) 打开 其 页 面 。 如 果 
你 只 需要 对 schema 中 的 对 象 进 行 授权 ， 可 以 直接 在 schema 名 
字 上 点 击 右键 并 选择 Grant Wizard， 打 开 的 页 面 上 只 会 出 现 该 
schema 所 拥有 的 对 象 。 如 同 其 他 许多 功能 项 一 样 ， 在 成 功 连 
到 数据 库 之 前 ， 其 菜单 项 一 直 都 是 灰 的 。 男 外 ， 该 菜 持 项 对 于 
当前 树 状 目 录 上 的 焦点 位 置 也 很 人 敏感， 点 击 到 不 同位 置 时 ， 访 
琳 单 项 就 会 显示 出 可 用 或 者 不 可 用 等 不 同 状 态 。 例 如 ， 要 为 
cesus 这 个 schema 中 的 项 设置 权限 ， 请 在 目录 树 上 选中 此 
schema 并 点 开 授 权 同 导 ， 界 面 如 图 4-8 所 示 。 然 后 你 就 可 以 选 
择 所 有 或 者 部 分 项 ， 然 后 切换 到 Privileges (权限 ) 选项 卡 上 
以 设置 你 想 要 授予 的 角色 和 权限 。 











| Languages 
人 全 schemas (3) 
© census 
Op # Create 
© CD Refresh... 
bieoool 便 Delete/Drop 
. 全 Drop Cascade 
CREATE Script 
Backup... 
让 Restore... 
吕 Grant Wizard... 
4 Query Tool... 


ygin/Group 


区 Properties... 





图 4-8: pgAdmin4 的 授权 向 导 


除了 为 已 有 对 象 授权 以 外 ， 我 们 日 常 遇 到 更 多 的 一 个 场景 是 为 
一 个 schema 或 者 database 中 新 建 的 对 象 设 置 默 认 权 限 。 要 执 

行 此 类 授权 ， 请 右键 单 击 schema 或 者 database 对 象 节 
然后 在 弹出 的 界面 上 点 击 


Grant Wizard - Object Selection (step 1 of 3) 


Please select objects from the list below. 









































人 sequence 
回 国 Table 
国 Table 
国 Table 
可 国 Table 
Yr 


Q Search by object type or name 
DIE 


census 


census 


census 


census 


Census 


后 选择 Properties《〈 属 性 ) 荣 单 项 ， 
切换 到 Default Privileges “默认 权限 ) 选 项 卡 ， 如 图 4-9 所 


帮 \。 


回 晶 | 


lu_fact_types fact type_id_seq | 


facts 
hisp_pop 
lu_fact_types 


lu_tracts 


ERIS/ 


点 ， 然 


© Schema - census 
General Security Default Prvileges SQL 
Tables Sequences Functions Types 


Default Prwvileges: Tables 


Grantee Privileges Grantor 
INSERT [jwrrn GRANT OPTION 
SELECT 回 wrru GRANTOPTION 
国 uPDATE |_ jwITH GRANT OPTION , 


i repuser 本 | 2 ostares ™ 
pgrep 加 DELETE |_JWITH GRANT OPTION 名 postgres 7 


TRUNCATE “| |WITH GRANTOPTION 











REFERENCES| |WITH GRANT OPTION 





TRIGGER |_|WITH GRANT OPTION 





se [x ce [ 基 


图 4-9: pgAdmin4 的 默认 授权 管理 


当 为 schema 授予 默认 权限 时 ， 请 记得 一 定 要 为 相应 的 组 角色 
授予 访问 此 schema 的 权限 。 


4.2.5 数据 导入 和 导出 
同 psql 一 样 ，pgAdmin 也 可 以 导入 和 导出 文本 文件 。 
a， 导 入 文件 
pgAdmin 的 导入 功能 其 实 是 对 psql 的 \copy 命令 做 了 一 层 封 





装 ， 并 要 求 导 入 数据 的 目的 表 必 须 已 建 好 。 要 实现 数据 导入 ， 
请 在 要 导入 数据 的 表 上 单 击 鼠 标 右键 。 图 4-10 显示 了 我 们 在 





lu_fact_types 表 上 点 击 右键 后 出 现 的 界面 。 


Languages ee 





orvExport data - table "Iu_fact_types’ 





ions Columns Options Coumns 


Filename 





Format 


Encodin' f 本 于 NULL Strings 


Header 


Quote 








图 4-10: pgAdmin4 的 Import( 导 入) 某 单 

. 使 用 pgAdmin 将 数据 导出 为 结构 化 文件 或 者 报表 格式 

除了 导入 数据 ， 你 还 可 以 将 查询 结果 导出 。pgAdmin3 文 持 导 
出 为 CSV、HTML 或 者 XML 格式 。pgAdmin4 的 导出 功能 比 
pgAdmin3 要 弱 很 多 。#* 


要 使 用 pgAdmin 导出 分 隔 符 文 本 格式 ， 请 按 以 下 步骤 操作 。 





y Query Tool 





(1) 打开 查询 窗口 〈 
(2) 编写 查询 语句 。 
(3) 执行 查询 语句 。 
(4) 如 琳 是 pgAdmin3， 请 点 击 菜单 栏 上 的 File -> Export; 如 采 


二 
是 pgAdmin4， 请 点 击 下 载 图 标 |， 并 设 定 下 载 目 标 位 


O 


(5) 如 果 是 pgAdmin3， 在 跳出 保存 页 面前 会 给 出 一 个 提示 ， 











pgAdmin4 则 没有 。 按 照 图 4-11 填写 设置 内 容 。 


雏 Export data to file 


Row separator Encoding 
© LF DS Local charset 
图 CRAF 图 Unicode UTF-8 


Col 
to ’ Po 
olumn separator DS no quoting 


Quote 中 ar 人 图 only strings 


Column names © all columns 





Filename Citestcv 





图 4-11: Export (导出 ) 菜单 


导出 为 HTML 或 者 XML 的 步骤 非常 类 似 ， 唯 一 的 差别 在 于 需 
要 点 击 菜单 栏 上 的 File > Quick Report (快速 报表 ) 选项 ， 参 
见 图 4-12。 





Quick report 


Report Notes 





WY] Indude the SQL in the report? 
Output format 

图 XHTML 1.0 Transitional 
SxML 

stylesheet 


(®) Embed 让 he default stylesheet 
© Embed an external stylesheet (specfied file must exist) 
DS Link to an external stylesheet 


Filename 


Output file c:\test,.html 是 











yjIDpen the output file in the default browser? 


re 











图 4-12: 导出 报表 选项 
4.2.6 备份 与 恢复 


pgAdmin 为 pg dump 和 pg_restore 提供 了 图 形 化 的 操作 界面 ， 
相关 具体 功能 已 在 2.7 节 中 介绍 过 。 本 节 内 容 中 ， 我 们 将 重复 使 用 
一 些 前 面 已 经 使 用 过 的 例子 ， 不 过 是 使 用 pgAdmin 来 执行 操作 ， 
而 非 使 用 命令 行 。 


如 果 你 的 机 器 上 安装 了 多 个 版 本 的 PostgreSQL 或 pgAdmin， 建 议 
你 先 确 认 pgAdmin 指向 了 正确 版 本 的 PostgreSQL 的 bin 目录 〔( 即 
pg_dump 、pg_restore 等 命令 行 工具 所 在 的 目录 ) ， 可 以 通过 检 
查 pgAdmin 的 bin 目录 设置 来 确认 ， 如 图 4-13 所 示 。 









pgAdmin 4 


Preferences 










时 -Browser EDB Advanced 


Server Binary 
Path Path to the directory containing the EDB Advanced 


Server utility programs (pg_dump, pg_restore etc) 


i Display 
: Nodes 


BB Dashboards 


: “Graphs 
i PostgreSQL $DIR/../runtime 
Debugger . 
Binary Path 
“Display Path to the directory containing the PostgreSQL utility 


日- Miscellaneous programs (pg_dump, pg_restore etc) 
““ User language 

日- Paths 

: Binary paths 

i .Help 

BB SQL Editor 
Fn Display 
: Explain 

i Options 

日 -Storage 
“Options 


? 


Bo 


图 4-13: pgAdmin File -，Preferences 荣 单 





从、 如 果 你 是 在 对 一 台 远 程 服务 器 进行 备份 或 者 恢复 操作 ， 
或 者 你 操作 的 数据 库 数 量 特别 庞大 ， 那 么 建议 你 使 用 命令 行 工 
有 具 而 不 要 使 用 pgAdmin， 因 为 此 种 情况 下 操作 过 程 本 来 就 已 经 
很 耗 时 ， 使 用 pgAdmin 操作 会 使 得 耗 时 和 复杂 度 增 加 。 另 外 
也 请 牢记 : 对 于 pg_dump 转 储 的 自 定义 压缩 格式 、TAR 包 格 
式 、 目 录 格 式 这 三 种 二 进 制 格 式 的 备份 文件 ， 必 须 使 用 与 
pg_dump 相同 或 者 更 新 版 本 的 pg_restore 工具 来 进行 恢复 。 


a， 完整 备份 一 个 database 中 的 数据 
在 2.7.1 节 中 ， 我 们 已 经 演示 了 如 何 完 整备 份 一 个 database。 下 


面 使 用 pgAdmin 界面 再 演示 一 授 操 作 过 程 。 请 右键 单 击 待 备 
份 的 database， 并 选择 Custom ( 自 定 义 ) 格式 ， 如 图 4-14 所 












0 


Backup (Database: postgresql_book) 





General Dump options 


Filename 








Format | Custom v | 





Compression 














ratio 
Encoding UTF8 xv| 
Number of jobs 
Role name | Select from the list v | 
图 4-14: 备份 database 
. 备份 系统 级 对 象 


pgAdmin 为 pg_dumpall 提供 了 一 个 图 形 化 界面 ， 用 于 对 系统 
对 象 进行 备份 。 要 使 用 该 界面 ， 请 先 连接 到 希望 备份 的 
PostgreSQL 服务 器 。 然 后 从 顶部 到 单 中 选择 Tools (工具 ) -~ 
Backup Globals (全 局 备份 )。 


pgAdmin 不 支持 指定 备份 哪些 全 局 对 象 ， 但 在 pg_dumpall 的 
可 以 的 。pgAdmin 默认 会 备份 所 有 的 系统 表 空 
间 和 和 5 


如 果 你 希望 备份 整个 服务 器 端的 所 有 数据 ， 可 以 通过 点 击 荣 单 
栏 上 的 Tools Backup Server 〈 备 份 服务 器 ) 来 实现 。 


. 选择 性 地 备份 部 分 数据 库 对 象 


pgAdmin 为 pg_dump 的 选择 性 备份 功能 提供 了 一 个 图 形 化 接 
口 。 在 希望 备份 的 数据 库 对 象 上 右键 单 击 ， 然 后 在 弹出 的 菜单 
中 选择 Backup( 如 图 4-15 所 示 ) 。 你 可 以 选择 备份 整个 
database、 一 个 特定 的 schema 或 者 任何 其 他 数据 库 对 象 。 





日 . 倪 schemas (5) 
由 oj census 
由 -@ 7 Create » 
© © Refresh... 
© 兽 Delete/Drop 
兽 Drop Cascade 


oo Srp GREATE Sein 


Tablespac 
全 Restore... 
@ Grant Wizard 
5 Query Tool... 
人 Properties... 





图 4-15: pgAdmin 的 schema 备份 


在 pgAdmin3 中 ， 如 果 和 希望 仅 备 份 当前 图 形 界面 上 选中 的 数据 
库 对 象 ， 那 么 你 可 以 忽略 备份 界面 上 的 其 他 选项 卡 〈 如 图 4-14 
所 示 ) ， 只 用 默认 设置 即 可 。 当 然 ， 你 也 可 以 切换 到 

Objects《〈 对 象 ) 选项 卡 选 择 备份 更 多 对 象 ， 如 图 4-16 所 示 。 
注意 该 特性 在 pgAdmin4 中 还 不 支持 。 


[¥ Database postgresql_book 
日 -网 CeNsUs 
IY. hisp_pop 














File Options | Dump Options #1 | Dump Options #2 Objects 


图 4-16: pgAdmin3 的 选择 性 备份 Objects 选项 卡 


人 pgAdmin 在 后 台 其 实 束 是 调用 了 pg_dump 命令 行 工 
有 具 来 实施 备份 动作 ， 如 果 你 希望 了 解 pgAdmin 最 终 使 用 
的 命令 是 什么 样子 ， 那 么 可 以 在 点 击 Backup 按钮 开始 执 
行 备份 后 切换 到 备份 界面 最 右 侧 的 Messages〈 消 息 ) 选项 
卡 ， 其 中 会 记录 系统 目 动 生成 的 带 参 数 的 pg_dump 命令 
行 。 


01. 4.3 pgScript 脚 本 机 制 


pgScript 是 pgAdmin3 内 置 的 一 种 脚本 机 制 ，pgAdmin4 还 不 文 持 此 
特性 。 该 机 制 非常 适合 于 重复 执行 SQL 任务 的 场景 。 相 比 
PostgreSQL 的 函数 机 制 ，pgScript 对 内 存 的 使 用 更 合理 ， 因 而 执行 
效率 更 高 。pgScript 机 制 之 所 以 能 达到 这 种 效果 ， 是 因为 
PostgreSQL 函数 机 制 会 将 所 有 工作 在 最 后 一 次 性 批量 提交 ， 此 前 未 
提交 的 工作 成 果 都 保存 在 内 存 中 。 相 比 之 下 ，pgScript 在 运行 脚本 
时 每 执行 一 条 SQL 语句 就 提交 一 次 ， 这 样 就 使 得 pgScript 特别 适 
合 执 行 会 消耗 大 量 内 存 而 又 不 需要 作为 一 个 完整 事务 来 提交 的 任 
务 。 一 旦 某 个 事务 被 提交 ， 则 该 事务 占用 的 内 存 会 立即 被 释放 ， 这 
部 分 内 存 即 可 用 于 下 一 个 事务 。 在 “Using pgScript for Geocoding” 这 
篇 博文 中 你 可 以 看 到 我 们 所 做 的 示例 。 


pgScript 脚本 语言 是 一 种 弱 类 型 语言 〈《 即 定义 变量 时 无 须 明 确 指定 
其 类 型 ) ， 支 持 条 件 判 断 、 和 循环、 数据 生成 器 、 基 本 的 打印 函数 以 
及 记录 型 变量 ， 其 语法 与 微软 SQL Server 数据 库 所 使 用 的 
Transact-SQL 语法 类 似 。 前 面 加 @ 的 是 变量 ， 可 以 存放 标量 或 数 
组 ， 包 括 SQL 命令 的 执行 结果 。DECLARE 、SET 、IF-ELSE 
、WHILE 等 语法 在 pgScript 中 都 支持 。 


可 以 在 SQL 查询 执行 窗口 中 执行 pgScript。 在 窗口 中 输入 脚本 后 ， 
点 击 pgScript 图 标 来 执行 〈 贤 ) 。 


下 面 将 演示 一 些 pgScript 脚本 的 例子 。 示 例 4-1 演示 了 如 何 使 用 
pgScript 记录 型 变量 和 循环 语法 来 构建 一 个 交叉 表 ， 使 用 的 基础 表 
是 lu_fact_types ， 该 表 是 我 们 在 示例 7-22 中 创建 的 。 以 下 
pgScript 脚本 中 创建 了 一 个 名 为 census.hisp_pop 的 空 表 ， 该 表 
有 以 下 数字 型 列 : hispanic_or_latino 、white_alone 和 
black_or_african_american_alone ， 以 及 其 他 一 些 列 。 


示例 4-1 在 pgScript 中 使 用 记录 型 变量 建 表 




















DECLARE @I, @labels, @tdef; 
SET @I = 6; 


变量 labels 将 用 于 存放 记录 





SET @labels = 
SELECT 
quote_ident( 
replacel 
replace(lower(COALESCE(fact subcats[4], fact subcats[3 
) 
) As col name, 
fact type_id 
FROM census.1lu fact types 
WHERE category = 'Population' AND fact subcats[3] ILIKE "Hispanic 
ORDER BY short name; 


SET @tdef = 'census.hisp pop(tract _ id varchar(11) PRIMARY KEY '; 

















使 用 LINES 函 数 来 循环 吉 历 每 一 条 记录 

WHILE @I < LINES(@labels) 

BEGIN 
SET Qtdef = Qtdef + ', ' + @labels[@I][8] + ' numeric(12,3) '; 
SET @I = QI +1; 

END 





SET Qtdef = Qtdef + ')'; 


打印 表 def 
PRINT Q@tdef; 


创建 表 
CREATE TABLE @tdef; 








尽管 pgScript 中 没有 专门 用 于 执行 动态 SQL 的 命令 ， 但 我 们 可 以 

通过 示例 4-1 中 所 示 的 方法 来 实现 执行 动态 SQL， 即将 SQL 字符 

串 分 配给 某 个 变量 。 我 们 在 示例 4-2 中 更 加 深入 地 挖掘 了 pgScript 
的 功能 ， 该 示例 中 我 们 对 上 面 刚刚 创建 好 的 census .hisp_pop 表 
进行 了 填充 操作 。 


示例 4-2 ”使 用 pgScript 循环 填充 表 








DECLARE @I, @labels, @tload, @tcols, @fact types ; 
SET QI = 6; 
SET @labels = 
SELECT 
quote ident( 
replacel 


replacel 
lower(COALESCE(fact subcats[4], fact subcats[3])), 
) 
) As col_ name, 

fact type_id 
FROM census.1lu fact types 
WHERE category = 'Population' AND fact subcats[3] ILIKE "Hispanic 
ORDER BY short name; 


SET @tload = 'tract id'; 
SET Qtcols = 'tract id'; 
SET Qfact types = '-1'; 


WHILE @I < LINES(@labels) 
BEGIN 
SET Qtcols = @tcols + ', ' + @labels[@I][8] ; 
SET @tload = @tload + 
', MAX(CASE WHEN fact type id= 
CAST(@labels[@I][1] As STRING) 


”THEN val ELSE NULL END)'; 
SET @fact types = Qfact types + '， 
SET @I = QI + 1; 
END 


INSERT INTO census.hisp pop(@tcols) 
SELECT Qt1load FROM census .facts 

WHERE fact type id IN(@fact types) AND 
GROUP BY tract id; 








从 上 面 的 示例 中 可 以 学 到 的 一 点 是 : 可 以 动态 地 往 一 个 变量 中 一 点 
点 加 入 SQL 语句 的 零碎 部 分 ， 最 终 组 成 一 个 完整 的 SQL 语句 。 


01. 4.4 ”以 图 形 化 方式 解释 执行 计划 


pgAdmin 最 为 人 称道 的 优秀 功能 之 一 就 是 它 能 够 以 图 形 化 方式 展示 
语句 执行 计划 。 打 开 SQL 语句 执行 窗口 ， 编 写 一 个 SQL 语句 ， 然 
后 点击 “解释 得 询 "图标 〈 转 ) 就 可 以 看 到 此 语句 的 执行 计划 图 
示 。 


例如 ， 执 行 以 下 碍 询 : 





SELECT left(tract id, 5) As county code, SUM(hispanic or latino) As to 
SUM(white alone) As tot white, 
SUM(COALESCE (hispanic or latino,96) - COALESCE(white _ alone,9)) As n 
FROM census.hisp pop 


GROUP BY county_code 
ORDER BY county_code; 





我 们 将 看 到 如 图 4-17 所 示 的 图 形 化 解释 。 读 懂 这 种 图 形 化 解释 有 
一 个 小 守门 ， 那 就 是 尽 可 能 让 粗 箭 头 变 细 ! 第 头 越 粗 ， 说 明 该 步 又 
的 执行 时 间 越 长 。 


之 


census.hisp_pop Sort Aggregate 


Temp Written Blocks 0 

Sort Key ("left"((hisp_pop.tract_id):-text, 5)) 
Node Type Sort 
Sort Space Used 

Actual Total Time 

Shared Hit Blocks 

Shared Read Blocks 

Local Hit Blocks 

Local Dirtied Blocks 

Sort Method quicksort 
Plan Width 40 
Actual Loops 1 

Actual Startup Time 0.883 
Temp Read Blocks 0 
Output ("left"((tract_id):-text, 5)),hispanic_or_latino,white_alone 
Local Read Blocks 0 

Sort Space Type Memory 
Startup Cost 111.29 
Shared Dirtied Blocks 0 
Shared Written Blocks 0 

Local Written Blocks 0 

Plan Rows 1478 
Parallel Aware EIT: 
Actual Rows 1478 
Parent Relationship Quter 
Total Cost 114.98 








图 4-17: 图 形 化 解释 示例 


如 果 SQL 语句 执行 器 菜单 栏 上 的 Query (查询 ) -Explain( 解 
释 ) ”Buffers《〈 绥 冲 区 ) 已 启用 ， 那 么 图 形 化 解释 就 会 被 禁用 。 
因此 切记 使 用 图 形 化 解释 时 不 要 局 用 该 选项 。 除 了 图 形 化 解释 之 
外 ，Data _ Output〈 数 据 输出 ) 选项 卡 上 还 会 显示 文本 解释 计划 ， 
本 例 中 的 输出 如 下 所 示 。 


GroupAggregate (cost=111.29..151.93 rows=1478 width=26) 
Output: ("left"((tract id)::text, 5)), sum(hispanic or latino), 
sum(white alone), 
-> Sort (cost=111.29..114.98 rows=1478 width=208) 
Output: tract id, hispanic or latino, white alone, 


("left"((tract id)::text, 5)) 
Sort Key: ("left"((tract id)::text, 5)) 
-> Seq Scan on census.hisp pop (cost=06.60..33.48 rows=1478 wi 
Output: tract id, hispanic or latino 
， White alone, "left"((tract id)::text, 5) 





01. 4.5 ”使 用 pgAgent 执 行 定时 任务 


pgAgent 是 PostgreSQL 中 执行 定时 任务 的 得 力 工具 。 同 时 它 也 可 用 
于 执行 操作 系统 批 处 理 脚 本 ， 因 此 在 Linux/Unix 系统 中 它 可 取代 
crontab ; 在 Windows 中 ， 它 可 取代 定时 任务 规划 器 。 事 实 上 ， 
pgAgent 的 定时 任务 功能 远 比 这 里 描述 的 更 强大 : 任何 一 台 机 器 ， 
不 管 操 作 系统 是 什么 ， 只 要 它 上 面 能 安装 pgAgent， 我 们 束 可 以 在 
其 上 执行 定时 任务 。 有 具体 步骤 是 先 在 这 台 机 器 上 装 好 pgAgent， 然 
后 设置 该 pgAgent 连接 到 一 个 PostgreSQL 数据 库 上 ， 但 需要 该 数 
据 库 上 预先 安装 好 pgAgent 所 需 的 功能 表 和 函数 。 执 行 定时 任务 的 
机 器 上 不 需要 安装 PostgreSQL 服务 端 软件 ， 但 客户 端 数据 库 是 必 
须 的 ， 因 为 要 保证 pgAgent 能 够 连接 到 外 部 的 PostgreSQL 服务 

器 。pgAgent 是 构建 于 PostgreSQL 架构 基础 上 的 ， 因 此 你 可 以 通过 
控制 服务 端的 表 数 据 来 控制 pgAgent 的 行为 。 例 如 ， 如 果 需 要 将 一 
个 复杂 的 定时 任务 复制 多 次 ， 那 么 你 只 需 直 接 登 录 到 PostgreSQL 
服务 器 并 往 pgAgent 的 表 中 插入 几 条 记录 即 可 ， 完 全 不 需要 在 
pgAmin 界面 上 对 pgAgent 执行 操作 。 











本 节 将 教 你 如 何 使 用 pgAgent。 在 “Setting Up pgAgent and Doing 
Scheduled Backups” 这 篇 博文 中 你 可 以 看 到 一 个 真正 实用 的 例子 以 
及 设置 细 市 。 


4.5.1 ”安装 DgAgent 


你 可 以 从 http://www.pgadmin.org/download/pgagent.php 下 载 

pgAgent 的 安装 包 。 在 Windows 上 ， 你 也 可 以 通过 EnterpriseDB 公 

司 提供 的 Stackbuilder 软件 和 BigSQL 公司 的 发 行 包 来 安装 

pgAgent。 安 装 包 中 的 SQL 脚本 会 在 postgres 库 中 目 动 创建 一 个 

名 为 pgAgent 的 新 shema。 人 然后 当 你 通过 pgAdmin 连 到 数据 库 服 

以 在 目录 树 上 看 到 一 个 名 为 Jobs〈 作 业 ) 的 新 节点 ， 如 
4-18 所 不 。 


量 - 刍 localhost 10 
(3 Databases (2) 
由 "| 9 postgres 
由 1[ 9 postgresql_book 
本 | . 
由 - 逆 Login/Group Roles 
由 Tablespaces 


[车 | pgAgent Jobs 
图 4-18: 安装 了 pgAgent 后 的 pgAdmin4 界面 


如 果 你 希望 在 其 他 机 器 上 安装 pgAgent 来 执行 定时 任务 ， 仅 需 在 目 
标 机 器 上 安装 pgAgent 客户 端 即 可 ， 而 无 顷 再 次 执行 pgAgent 自 带 
的 SQL 脚本 ， 因 为 这 个 脚本 只 需 在 PostgreSQL 服务 端 执 行 一 次 即 
可 。 请 特别 注意 pgAgent 服务 所 使 用 的 操作 系统 账户 的 权限 设置 ， 
一 定 要 确保 每 个 pgAgent 客户 问 实 例 都 有 执行 任务 所 需 的 权限 。 











外 即使 批 处 理 任 务 能 以 命令 行 方式 执行 成 功 ， 也 并 不 代表 
通过 pgAgent 来 执行 此 任务 就 一 定 会 成 功 。 这 一 般 是 因为 权限 
原因 导致 ，pgAgent 总 是 以 pgAgent 服务 所 使 用 的 操作 系统 账 

户 的 号 份 执行 规划 的 任务 ， 如 果 此 账户 没有 足够 的 权限 来 执行 
| 问 某 些 必需 路 径 的 权限 ， 那 么 任务 就 
会 失败 。 


4.5.2 ”规划 定时 任务 
每 个 定时 任务 包含 两 个 组 成 要 素 :任务 步骤 以 及 执行 计划 。 当 创建 


一 个 新 的 任务 时 ， 先 新 增 一 个 或 者 多 个 任务 步 怠 。 图 4-19 是 新 增 / 
编辑 任务 步 又 的 界面 。 











图 4-19: pgAdmin 的 分 步 编辑 屏幕 


在 每 一 个 任务 步骤 中 ， 你 可 以 设 定 一 条 SQL 语句 或 者 指定 一 个 
shel 网 本 作为 任务 内 容 ， 其 至 可 以 复制 一 此 段 shel 向 本 作为 任务 


如 果 你 选择 了 使 用 SQL 语句 ， 那 么 连接 类 型 选项 会 变 为 可 用 并 且 
默认 值 会 被 设 为 本 地 ， 这 种 情况 下 该 任务 步骤 中 的 SQL 会 在 
pgAgent 服务 端 所 在 的 PostgreSQL 服务 器 上 执行 ， 并 使 用 pgAgent 
运行 时 使 用 的 用 户 名 和 密码 来 进行 身份 验证 。 另 外 还 需要 指定 
pgAgent 在 执行 此 任务 时 要 连接 的 目标 database。 界 面 上 有 一 个 下 
拉 列 表 供 你 选择 具体 的 database。 如 果 你 选择 了 连接 到 远 端 数据 库 
服务 器 ， 那 么 供 输入 连接 字符 串 的 文本 框 会 变 为 可 用 状态 。 请 在 此 
框 中 输入 完整 的 连接 字符 串 ， 包 括 用 于 身份 验证 的 信息 以 及 要 连接 
的 目标 database。 如 果 你 连 到 一 个 早期 版 本 的 远 端 PostgreSQL 数据 
的 SQL 语句 的 语法 在 该 老 版 本 的 PostgreSQL 上 


如 果 你 选择 了 执行 批 处 理 任务 ， 那 么 其 语法 必须 符合 执行 此 任务 的 
操作 系统 的 要 求 。 例 如 ， 如 果 pgAgent 运行 于 Windows 环境 下 ， 
那么 批 处 理 任务 脚本 必须 是 合法 的 DOS 命令 行 脚 本 ; 如 果 pgAgent 
运行 于 Linux 环境 ， 那 么 批 处 理 任务 脚本 必须 是 合法 的 shell 脚 








本 。 


多 个 任务 步骤 之 间 是 以 其 名 称 的 字母 顺序 来 排序 并 执行 的 。 你 可 以 
指定 每 个 步 又 执行 完毕 后 的 处 理 方式 : 如 果 该 步骤 执行 成 功 则 如 何 
处 理 ， 如 果 该 步骤 执行 失败 又 如 何 处 理 。 你 可 以 选择 茶 用 某 些 步 又 
而 不 删除 它们 ， 因 为 你 以 后 可 能 会 重新 用 上 这 些 步 又。 


任务 步 又 设 定 好 之 后 ， 你 束 可 以 设 定 执 行 计划 来 执行 这 些 步 又 了 。 
通过 执行 计划 页 面 你 可 以 设 定 极为 复 森 的 执行 策略 ， 你 甚至 可 以 设 
置 多 个 执行 计划 。 


如 果 你 在 多 台 机 器 上 安装 了 pgAgent， 而 这 些 pgAgent 都 连 到 同一 
个 pgAgent 服务 端 数据 库 ， 那 么 默认 情况 下 所 有 这 些 pgAgent 会 执 
行 数据 库 中 记录 的 所 有 计划 任务 。 


如 果 你 希望 某 个 计划 任务 只 在 某 台 特定 的 机 器 上 执行 ， 那 么 可 以 在 
创建 计划 任务 时 将 页 面 上 的 host agent (主机 代理 ) 字段 设置 为 
希望 执行 此 计划 任务 的 目标 主机 名 。 这 样 其 他 机 器 上 的 pgAgent 会 
0 目标 主机 名 与 自己 所 在 主机 名 不 符 ， 从 而 忽略 此 
王 务 。 














本 pgAgent 包含 两 部 分 数据 : 定义 任务 的 数据 以 及 任务 执 
行 日 志 。 这 些 任务 日 志 会 记录 在 pgAgent 这 个 schema 中 ， 而 
pgAgent schema 一 般 隶 属于 postgres 数据 库 。pgAgent 进程 
会 查询 待 执行 的 任务 信息 以 决定 接 下 来 执行 什么 任务 ， 然 后 在 
执行 过 程 中 把 相关 的 任务 日 志 信 息 写 入 数据 库 中 。 一 般 来 说 ， 
用 于 承载 这 两 类 数据 的 PostgreSQL 服务 器 和 pgAgent 是 运行 
于 同一 台 服 务 器 上 的 ， 但 并 不 是 必须 如 此 ， 二 者 可 以 分 离 部 
团 。 此 外 ， 一 台 PostgreSQL 服务 器 可 以 服务 于 很 多 部 署 在 不 
同 主机 上 的 pgAgent。 


一 个 完整 的 定时 任务 看 起 来 如 图 4-20 所 示 。 





we pgAgent Jobs (1) 
Sel Maintenance 
日 -区 schedules (1) 
© Daily 
a Steps (1) 
Vacuum tables 


图 4-20: pgAdmin 界面 上 的 pgAgent 定时 任务 


4.5.3 一些 有 用 的 pgAgent 相 关 查 询 语 句 


如 果 你 SQL 技术 高 超 ， 那 么 完全 可 以 通过 直接 修改 pgAgent 的 元 
数据 表 来 实现 对 定时 任务 的 复制 、 删 除 和 修改 。 只 是 在 修改 时 要 特 
别 小 心 谨慎 ， 不 要 搞 错 ! 例如 ， 要 想 查看 控制 着 1 pgAgent 和 定时 任 
务 具体 行为 的 后 台 表 内 容 ， 只 需 连 到 postgres 数据 库 并 执行 示例 
4-3 中 的 查询 。 


示例 4-3 ”查询 pgAgent 相关 表 的 描述 信息 














SELECT c.relname As table name, d.description 
FROM 


pg_class As c INNER JOIN 
pg_namespace n ON n.oid = c.relnamespace INNER JOIN 
pg_description As d ON d.objoid = c.oid AND d.objsubid = 6 
WHERE n.nspname = “pgagent- 
ORDER BY c.relname; 


table_name | description 

一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 二 +------------------------- 
pga_job | Job main entry 
pga_jobagent | Active job agents 


pga_jobclass | Job classification 


pga_joblog Job run logs. 


pga_jobsteplog 
pga_schedule 


Job step run logs. 


| 

pga_jobstep | Job step to be executed 
| 
| Job schedule exceptions 





尽管 在 pgAdmin 中 制定 pgAgent 定时 任务 和 观察 其 执行 日 志 的 界 
面 已 经 非常 直观 易 恒 ， 但 如 果 你 设置 了 很 多 定时 任务 或 者 你 希望 查 
看 上 自己 的 定时 任务 执行 结果 总 览 ， 那 么 就 需要 生成 自己 的 定时 任务 
。 示 例 4-4 演示 了 我 们 在 此 情况 下 经 党 会 使 用 的 一 个 查询 
语句 。 


示例 4-4 列 出 从 今天 开始 的 定时 任务 执行 结 采 


SELECT j.jobname, s.jstname, 1.jslstart,1.jslduration, 1.jsloutput 
FROM 


pgagent.pga_ jobsteplog As 1 INNER JOIN 
pgagent.pga jobstep As s ON s.jstid = 1.jsljstid INNER JOIN 


pgagent.pga_ job As j ON j.jobid = s.jstjobid 
WHERE jslstart > CURRENT_DATE 
ORDER BY j.jobname, s.jstname, 1.jslstart DESC; 





有 了 时候 定 时 任务 即使 失败 了 也 会 报 成 功 ， 因 为 pgAgent 并 不 总 能 准 
确 判 断 shell 脚本 的 执行 结果 到 底 是 成 功 还 是 失败 。 日 志 中 的 
jsloutput 字段 提供 shell 输出 ， 该 输出 通常 会 详细 说 明 哪 里 出 现 
了 错误 。 





从、 在 Windows 平台 上 ， 有 若干 个 版 本 的 pgAgent 经 常会 
把 事实 上 已 执行 成 功 的 shell 脚本 的 执行 结果 判定 为 执行 失 
败 。 如 果 你 遇 到 了 这 种 情况 ， 那 么 应 该 把 任务 步骤 的 结果 处 理 
方式 设 定 为 “错误 时 忽略 ”。 这 是 一 个 已 知 的 bug， 我 们 希望 在 
将 来 的 版 本 中 能 够 尽快 修复 。 


01. 


第 5 半 数据 类 型 


与 其 他 所 有 数据 库 一 样 ，PostgreSQL 也 支持 数字 型 、 字 符 串 型 、 日 
期 型 、 时 间 型 以 及 布尔 型 等 业界 常用 的 数据 类 型 。 但 PostgreSQL 
的 先进 之 处 在 于 它 还 文 持 数组 、 硕 时 区 的 日 期 时 间 、 时 间 间 隔 、 区 
间 、JSON、XML 以 及 其 他 很 多 数据 类 型 ， 此 外 还 支持 用 户 自 定义 
数据 类 型 。 本 章 不 会 一 一 介绍 PostgreSQL 支持 的 所 有 数据 类 型 ， 

如 有 果 你 需要 了 解 的 话 ， 请 自行 参考 官方 手册 。 我 们 将 着 重 介绍 
PostgreSQL 独 有 的 寿 干 数据 类 型 ， 以 及 在 通用 数据 类 型 方面 
PostgreSQL 与 其 他 数据 库 有 哪些 细微 差异 。 


如 采 离 开 了 相应 的 函数 和 运算 符 ， 数 据 类 型 将 完全 无 用 武之 地 。 
PostgreSQL 为 各 种 数据 类 型 提供 了 功能 强大 、 种 类 丰富 的 原生 函数 
和 运算 符 支 持 。 本 章 将 介绍 一 些 使 用 比较 广泛 的 类 型 。 





外 我 们 所 说 的 函数 是 指 f(x) 这 种 形式 的 函数 ; 我 们 所 说 
的 “运算 符 ” 是 指 一 些 符号 性 的 运算 符号 ， 比如 +、-、*、/ 

， 有 具体 可 分 为 需要 单个 参数 的 一 元 运算 符 和 需要 两 个 参数 的 二 
元 运算 符 。 当 使 用 运算 符 时 ， 请 记 住 它 在 面 对 不 同 的 数据 类 型 
时 所 代表 的 含义 是 不 同 的 。 比 如 加 号 对 数字 来 说 就 是 相 加 ， 对 
区 间 类 型 来 说 束 是 区 间 的 并 集 。 








01. 5.1 数值 类 型 


PostgreSQL 支持 常用 的 整数 、 小 数 、 浮 反 数 等 数字 类 型 。 本 节 想 重 
点 介绍 的 是 serial 类 型 以 及 一 个 灵活 实用 的 整数 序列 生成 函数 。 


5.1.1 serial 类 型 


serial 类 型 和 它 的 兄弟 类 型 bigserial 是 两 种 可 以 自动 生成 递增 
整数 值 的 数据 类 型 ， 一 般 如 果 表 本 身 的 字段 不 适合 作为 主键 字段 ， 
会 增加 一 个 专门 的 字段 并 指定 为 serial 类 型 以 作为 主键 。 在 不 同 
的 数据 库 产 品 中 这 种 数据 类 型 有 着 不 同 的 称呼 ， 一 般 最 常见 的 叫 法 
是 autonumber 。 创 建 表 时 如 果 指 定 了 一 个 字段 类 型 为 serial ， 
那么 PostgreSQL 会 首先 将 其 作为 整 型 处 理 ， 同 时 目 动 在 该 表 所 在 
schema 中 创建 一 个 名 为 table_name_column_name_seq 的 序列 。 
然后 设 定 该 序列 为 该 整 型 字段 的 取 值 来 源 。 如 果 修 改 了 表 定 义 并 删 
除 此 serial 字段 ， 那 么 系统 同时 也 会 自动 删除 附属 的 序列 。 


在 PostgreSQL 中 ， 序 列 目 身 就 是 一 种 数据 库 资 产 。 可 以 通过 
pgAdmin 网 形 界面 或 者 ALTER SEQUENCE 语句 来 管理 该 类 对 象 。 

可 以 设置 其 当前 值 和 边界 值 〈 也 就 是 最 大 值 和 最 小 值 ) ， 还 可 以 设 
置 每 次 递增 的 步 长 。 虽 然 一 般 来 说 序列 值 都 是 递增 的 ， 但 你 也 可 以 
将 其 设 为 递减 ， 只 要 将 步 长 值 increment 设 为 负数 即 可 。 作 为 一 
种 独立 的 数据 库 资产 ， 你 可 以 通过 CREATE SEQUENCE 命令 来 创建 
序列 ， 还 可 以 在 多 张 表 间 共用 一 个 序列 。 如 果 需 要 生成 一 个 跨越 多 
表 的 唯一 键 值 ， 那 么 这 种 多 表 共 享 序列 的 用 法 特别 方便 。 

如 需 多 表 共 享 同 一 个 现存 的 序列 扎 生 成 器 ， 先 为 每 张 表 新 增 一 个 类 
型 为 integer 或 者 bigint 的 字段 ， 然 后 指定 其 默认 值 为 
nextval(sequence_name) 即 可 ， 语 法 如 示例 5-1 所 示 。 


示例 5-1 在 新 表 上 使 用 现存 的 序列 号 生成 喜 


CREATE SEQUENCE s START 1; 
CREATE TABLE stuff(id bigint DEFAULT nextval('s') PRIMARY KEY, name te 




















仆 如 果 你 重 命名 了 一 张 含 serial 字段 的 表 ， 这 张 表 的 
serial 字段 关联 的 序列 号 生成 句 是 不 会 跟着 改名 的 ， 但 关联 
运作 机 制 是 不 受 影响 的 。 为 避免 混 清 ， 可 以 手动 修改 序列 号 生 
成 锅 的 名 称 以 保持 与 表 名 一 致 。 


5.1.2 ”生成 数组 序列 的 函数 


PostgreSQL 有 一 个 名 为 generate_series 的 灵活 又 实用 的 数组 生 
成 函数 ， 目 前 为 止 我 们 还 没 发现 有 哪 种 数据 库 支 持 类 似 功能 。 该 函 
数 支 持 两 种 使 用 形式 。 它 可 以 用 来 生成 一 个 按 一 定 步 长 递增 的 整数 
序列 ， 也 可 以 用 来 生成 一 个 以 一 定时 间 间 隔 作 为 步 长 来 递增 的 日 期 
或 者 时 间 惟 序列 。generate_series 函数 的 方便 之 处 在 于 ， 你 可 
以 使 用 它 有 效 地 模仿 SQL 中 的 for 循环 。 示例 5-2 演示 了 如 何 生 
成 一 个 整数 序列 。 示 例 5-13 演示 了 如 何 生成 时 间 序 列 。 


示例 5-2 使 用 可 选 的 步 长 参数 来 生成 整数 序列 。 


示例 5-2 使 用 generate_series() 函数 生成 步 长 为 13 的 
整数 序列 


SELECT x FROM generate series(1,51,13) As X; 





如 果 不 输入 步 长 ， 则 默认 步 长 为 1。 如 示例 5-2 所 示 ， 你 可 以 传 入 
一 个 可 选 的 步 长 参数 来 指定 对 于 每 个 后 续 元 素 要 跳 过 多 大 的 步 长 。 

另外 请 注意 : 结束 值 将 永远 不 会 超出 我 们 指定 的 区 间 ， 因 此 ， 尽 管 
我 们 的 区 间 结 束 于 51， 但 最 后 一 个 数字 是 40， 因 为 40 再 加 上 13 

就 会 超出 上 限 。 








01. 5.2 ”文本 类 型 


PostgreSQL 有 三 种 最 基础 的 文本 数据 类 型 : character (也 称 为 
char ) 、character varying 〈 也 称 为 varchar ) 和 text 。 


仅 当 需要 存储 邮政 编码 、 电 话 号 码 以 及 美国 的 社会 保险 号 等 定 长 字 
符 串 时 ， 才 应 使 用 char 类 型 。 如 果 存 储 的 字符 长 度 达 不 到 char 
类 型 的 定义 长 度 ， 那 么 PostgreSQL 会 自动 在 后 面 用 空格 填充 ， 直 
到 填 满 定义 的 长 度 为 止 。 相 比 varchar 或 者 text ，char 的 右 补 
齐 空格 机 制 会 导致 存储 空间 的 浪费 ， 得 到 的 好 处 是 可 以 确保 字符 串 
是 定 长 的 。 可 以 确认 的 是 ，char 比 起 varchar 和 text 没有 任何 
性 能 优势 ， 却 一 定 会 占用 更 多 的 空间 。 如 果 要 存储 变 长 字符 串 ， 请 
使 用 varchar 类 型 。 当 为 表 定 义 varchar 类 型 的 字段 时 ， 应 为 其 
text 类 型 是 最 通用 的 字符 存储 类 型 ， 不 需要 设 最 


varchar 类 型 的 最 大 长 度 其 实 是 可 选 的 。 如 果 不 设 定 的 

话 ，varchar 与 text 几乎 没有 任何 区 别 ， 但 当 通 过 一 些 特定 的 驱 
动 连 到 PostgreSQL 时 ， 二 者 还 是 能 表现 出 一 些微 小 的 差异 。 比 
如 ，ODBC 驱动 可 以 对 varchar 字段 进行 排序 ， 却 不 文 持 text 类 
型 的 排序 。varchar 和 text 类 型 字段 的 存储 空间 上 限 均 为 约 
1GB， 这 是 一 个 很 大 的 值 了 。 事 实 上 ， 系 统 在 后 台 会 用 TOAST 机 制 
处 理 超过 一 个 物理 存储 页 大 小 的 内 容 。 


有 人 认为 应 该 彻底 废弃 varchar 并 完全 转 用 text ， 关 于 这 一 点 ， 
业界 一 直 有 着 不 同 的 声音 。 此 处 不 会 浪费 篇 幅 争 论 此 问题 ， 请 参 
考 “In Defense of Varchar(X)” 这 篇 博文 以 了 解 这 场 争论 的 详情 。 


有 时 候 ， 为 了 保持 路 平台 应 用 的 兼容 性 ， 需 要 使 字符 串 类 型 的 操作 
变 得 不 区 分 大 小 写 。 要 实现 此 目标 ， 需 要 重 写 那 些 区 分 大 小 写 的 比 
较 运 算 符 。 相 比 text ， 对 varchar 进行 运算 符 重 写 要 更 容易 一 
些 。 我 们 在 “Using MS Access with PostgreSQL” 这 篇 博文 中 ， 演 示 
了 如 何 使 varchar 类 型 变 得 不 区 分 大 小 写 而 且 还 能 够 用 上 索引 。 























5.2.1 字符 串 函 数 


常见 的 字符 串 操作 包括 : 填充 (lpad 、rpad ) 、 修 整 空 白 
CrFtrim 、1Ltrim 、trim 、btrim ) 、 提 取 子 字符 串 
(substring ) 以 及 连接 (|| ) 。 示 例 5-3 演示 了 填充 操作 ， 示 

例 5-4 演示 了 修整 空白 操作 。 


示例 5-3 使 用 1lpad 和 rpad 进行 填充 操作 


SELECT 
lpad('ab', 4, '0') As ab 1pad， 
Frpad('ab'，4，'6') As ab_rpad, 
lpad('abcde', 4, '0') As ab lpad trunc; © 


ab lpad | ab_rpad | ab lpad trunc 


ab66 | abcd 





@ 如 果 字 符 串 超过 指定 长 度 ，1pad 不 但 不 会 填充， 反而 会 对 其 进 
行 截断 。 


默认 情况 下 ，trim 函数 用 于 移 除 空格 ， 但 你 也 可 以 传 入 一 个 可 先 
参数 ， 指 示 要 剪裁 的 其 他 字符 。 


示例 5-4 “ 筋 裁 空格 和 字符 





SELECT 
a As a before, trim(a) As a trim, rtrim(a) As a_rt, 
i As i before, ltrim(i, '6') As i 1t 6， 
rtrim(i, '60') As i rt 8, trim(i, '6') As i t 0 


FROM ( 
SELECT repeat(' ', 4) || i || repeat(' ', 4) As a，'6' || iAs 
FROM generate series(60, 260, 506) As i 
) As X; 
a_before | atrim | art |ibefore |ilitel|lirte6e1|1it9 
-=------------ +--------+---------+----------+--------+--------+------- 
6 | 8 | 9 | 86 | | | 
56 | 56 | 56 | e506 | 56 | @5 | 5 
166 | 166 | 166 | 868166 | 166 | 61 | 1 
156 | 156 | 156 | 8156 | 156 | 815 | 15 
266 | 266 | 266 | 8266 | 266 | 62 | 2 


| | 


有 一 个 很 有 用 的 字符 串 操 作 函 数 string_agg ， 我 们 已 在 示例 3-14 
中 展示 了 其 用 法 ， 你 还 将 在 示例 5-26 中 再 次 见 到 它 。 


5.2.2 ”将 字符 串 拆 分 为 数组 、 表 或 者 子 字 符 串 

PostgreSQL 中 有 一 些 函 数 可 以 对 字符 串 进 行 拆 分 操作 。 

split_part 函数 可 以 将 指定 位 置 的 元 素 从 用 固定 分 隅 符 分 隔 的 字 

Ge 0 5-5 所 示 。 这 里 我 们 取出 用 圆 点 分 隅 的 字符 
三 个 元 素 


示例 5-5 ”取出 分 隔 符 字符 串 中 的 第 nn 个 元 系 











SELECT split part('abc.123.z45','.', 2) As X; 





string_to_array 岗 数 可 以 将 基于 固定 分 隔 符 的 字符 串 拆 分 为 一 
个 数组 。 通 过 结合 使 用 string_to_array 和 unnest 函数 ， 可 以 
将 一 个 字符 串 展开 为 阁 干 记录 行 ， 如 示例 5-6 所 示 。 

示例 5-6 将 基于 固定 分 隅 符 格 式 的 字符 串 展开 为 记录 行 


SELECT unnest(string to array('abc.123.z45', '.')) As x; 





5.2.3 ”正则 表达 式 和 模式 匹配 


PostgreSQL 对 正则 表达 式 的 支持 是 极其 强大 的 。 你 可 以 设 定 查 询 返 
回 结果 的 格式 为 表 或 者 数组 ， 并 有 旦 对 其 进行 极其 复杂 的 蔡 换 和 更 新 
操作 。 包 括 逆向 引用 (back reference) 在 内 的 一 些 高 级 搜索 方法 都 
是 支持 的 。 本 节 将 提供 一 个 小 型 的 示例 以 说 明 这 些 内 容 。 如 需 了 解 
更 多 相关 信息 ， 请 参考 PostgreSQL 官方 手册 中 的 “模式 匹配 ?和 “ 字 
符 串 函数 ”这 两 节 的 内 容 。 


2 5-7 展示 了 如 何 对 以 数字 形式 存储 的 电话 号 码 进行 格式 化 操 








示例 5-7 ”使 用 逆向 引用 技术 对 电话 号 码 进行 重新 格式 化 


SELECT regexp_replacel 
'61973866254'， 
'([@-9]{3})([8-9]{3})([e-9]{4})", 
E'\(\\1\) \\2-\\3) 


(619) 736-6254 





\\1 和 \\2 是 模式 死 配 表达 式 中 的 元 素 。 我 们 使 用 反 斜 枉 〈\ ) 来 
转 义 圆 括号 ， 表 示 此 处 是 真 的 要 作为 一 个 圆 括号 来 用 。E ' 是 
PostgreSQL 的 特有 语法 ， 表 示 后 续 跟 大 的 字符 串 是 一 个 表达 式 ， 其 
中 类 似 \ 的 特殊 字符 应 该 按照 字面 含义 来 处 理 。 


假设 一 个 字符 串 中 内 嵌 了 一 些 电话 号 码 ， 示 例 5-8 演示 了 如 何 仅 通 
过 一 个 SQL 语句 就 将 这 些 号 码 提取 出 来 并 作为 记录 行 输出 。 


示例 5-8 ”将 文本 中 的 电话 号 码 作 为 单独 的 行 返回 














SELECT unnest(regexp_matches( 

'Cell (619) 852-5683. Work (619)123-4567 ,Casa 619-736-6254. Bésame m 

0 'g') 
AS XxX; 


(619) 852-5683 
(619)123-4567 
619-736-6254 
(3 rows ) 








示例 5-8 中 用 到 的 匹配 规则 如 下 所 示 。 


。[(]{8,1} : 开始 是 0 个 或 者 1 个 (。 

。 [96-9]{3} : 跟着 3 位 数字 。 

。[)-.]{6,1} : 跟着 0 个 或 者 1 个 )、- 或 者 . 。 

。 [6-9]{4}+ : 跟着 4 位 数字 。 

。 regexp_matches 函数 会 返回 根据 一 个 正则 表达 式 科 选 匹配 得 
到 的 字符 串 数 组 。 该 函数 的 最 后 一 个 入 参 名 为 flags ， 我 们 
为 其 输入 的 值 是 g ，g 代表 global， 即 需要 进行 完整 搜索 并 返 
回 所 有 匹配 上 的 字符 串 ， 每 个 字符 串 作 为 数组 中 的 一 个 元 素 。 
如 果 不 填 该 flags 参数 ， 那 么 返回 的 结果 只 会 包含 第 一 个 命 
中 的 字符 串 。 请 注意 ，flags 参数 中 可 以 包含 多 个 标记 。 例 
如 ， 如 果 你 的 正则 表达 式 中 含有 一 些 字 符 ， 你 又 希望 在 做 正则 
匹配 时 不 区 分 这 些 字符 的 大 小 写 〈 即 不 管 大 小 写 都 命中 ) ， 同 
时 还 希望 返回 所 有 匹配 上 的 字符 串 而 不 仅仅 返回 第 一 个 ， 那 么 
可 以 用 gi 这 个 复合 标记 。 除 此 以 外 还 支持 其 他 一 些 标记 ， 完 
， | 列表 可 以 从 官方 手册 的 “POSIX 标准 中 的 藤 入 式 选 项 ”部 分 

I 
。 unnest 函数 将 一 个 数组 分 解 为 一 个 行 集 。 














< 同一 个 正则 表达 式 可 以 有 多 种 写法 。 比 如 ，\\\d 代表 

[6-9] 。 但 我 们 建议 不 要 为 了 省 那儿 个 字符 而 把 表达 式 搞 得 太 
星 深 难 懂 ， 应 该 采用 更 加 容易 理解 的 写法 。 

如 果 只 需要 命中 第 一 条 ， 那 么 可 以 使 用 substring 函数 ， 如 示例 

5-9 所 示 。 


示例 5-9 ”从 一 段 文 本 中 得 找 第 一 个 电话 号 码 





SELECT substring( 
'Cell (619) 852-5683. Work (619)123-4567 ,Casa 619-736-6254. Besame m 
from E'[(]{0,1}[80-9]{3}[)-.]{8,1}[\\s]{8,1}[6-9]{3}[-.]{0,1}[0-9]{4}') 


(619) 852-5683 
(1 row) 





除了 正则 表达 式 专 用 的 那些 函数 外 ， 你 还 可 以 将 正则 表达 式 与 


SIMILAR TO (~ ) 运算 符 一 起 使 用 。 以 下 查询 可 以 查 出 所 有 内 岂 
了 电话 号 码 的 description 字段 : 





SELECT description 
FROM mytable 
WHERE description ~ 


E'[(]{0,1}[0-9]{3}[)-.]{8,1}[\\s]{0,1}[6-9]{3}[-.]{0,1}[6-9]{4}"; 





01. 5.3 时间 类 型 


PostgreSQL 对 时 间 类 型 的 支持 在 业界 是 无 人 能 及 的 。 除 了 常见 的 日 
期 和 时 间 类 型 ，PostgreSQL 还 支持 时 区 ， 并 能 够 按照 不 同 的 时 区 对 
夏令 时 进行 自动 转换 。 此 外 PostgreSQL 还 支持 一 些 特殊 的 数据 类 
型 ， 如 interval ， 该 类 型 可 以 用 于 对 日 期 时 间 进 行 数学 运算 。 
PostgreSQL 还 有 下 无 穷 大 和 人 负 无 穷 大 的 概念 ， 这 样 我 们 束 不 用 为 了 
表达 这 两 个 概念 而 弄 出 一 些 奇 奇怪 怪 的 潜 规 划 ， 搞 这 些 潜 规 则 述 早 
会 导致 问题 。 区 间 类 型 可 以 表达 时 间 区 间 的 概念 ， 并 且 提 供 了 大 量 
宁 区 间 运 算 相 关 的 运 罩 符 、 函数 和 索引 。5.5 节 中 会 详细 介绍 该 类 
型 。 


在 最 新 的 版 本 中 ，PostgreSQL 文 持 9 种 与 时 间 相 关 的 数据 类 型 。 理 
解 这 些 类 型 之 间 的 区 别 很 重要 ， 人 否则 你 束 无 法 为 不 同业 务 场景 选择 
适用 的 数据 类 型 。 除 了 range 类 型 外 ， 其 他 所 有 类 型 都 遵循 ANSI 
SQL 标准 。 业 界 的 其 他 数据 库 最 多 文 持 这 些 类 型 中 的 一 部 分 而 非 所 
有 。Oracle 支持 的 类 型 最 多 ，SQL Server 其 次 ，MySQL 又 次 之 。 


PostgreSQL 的 每 种 时 间 类 型 都 有 其 独特 之 处 。 对 于 其 中 支持 时 区 的 
类 型 ， 如 果 数 据 库 服务 器 所 在 的 时 区 发 生 了 改变 ， 则 该 类 型 中 存储 
的 数据 会 自动 针对 新 的 时 区 进行 调整 以 保证 时 间 一 致 。 接 下 来 对 它 
们 进行 更 详细 的 介绍 。 

date 


该 类 型 仅 存储 月 、 日 、 年 ， 没 有 时 区 、 小 时 、 分 和 秒 的 信息 。 














time 〈 又 称 time without time zone ) 
该 类 型 仅 存 储 小 时 、 分 、 秒 信息 ， 不 帝 日 期 和 时 区 信息 。 
timestamp 〈 又 称 timestamp without time zone ) 


该 类 型 存储 了 日 期 (年 、 月 、 日 ) 和 时 间 〈 时 、 分 、 秒 ) 数 
据 ， 但 不 带 时 区 信息 。 因 此 ， 即 使 你 修改 了 数据 库 服务 器 所 在 的 时 
区 信息 ， 该 类 字段 查询 出 来 显示 的 值 也 古 固 定 不 变 的 。 





timestamptz (又 称 timestamp with time zone ) 


该 类 型 同时 存储 了 日 期 、 时 间 以 及 时 区 信息 。 在 系统 内 部 ， 访 
类 型 的 字段 值 是 以 UTC 世界 标准 时 间 格 式 存储 的 ， 但 当 查 询 显示 
时 ， 会 按照 服务 器 的 时 区 设置 进行 换算 后 再 显示 (时 区 也 可 以 在 库 
级 /用 户 级 /会 话 级 分 别 进行 设置 ) 。 如 果 你 输入 的 时 间 戳 不 带 时 
区 数据 ， 那 么 存 入 timestamptz 类 型 字段 中 时 ，PostgreSQL 会 自 
动 使 用 当前 数据 库 服 务 器 的 时 区 信息 来 补充 。 如 果 修 改 了 数据 库 服 
务 器 的 时 区 设置 ， 你 可 以 看 到 查询 出 来 的 时 间 数 据 发 生 了 变化 。 





timetz (又 称 time with time zone) 


与 timestamptz 类 型 类 似 ， 但 该 类 型 的 使 用 频率 较 低 ， 因 为 
它 虽然 携带 了 时 区 信息 却 没有 日 期 信息 。 该 类 型 永远 假设 当前 时 间 
是 夏令 时 。 有 的 编程 语言 不 文 持 这 种 仪 有 时 间 而 无 日 期 的 数据 类 
型 ， 因 此 可 能 会 将 其 自动 转换 为 带 时 区 的 时 间 惟 类 型 ， 转 换 时 日 期 
就 取 计 算 机 系统 时 间 的 初始 值 ( 例 如 ，Unix 时 间 纪 元 起 始 于 1970 
0 日 期 就 是 1970 年 1 月 1 日 时 区 和 时 间 不 变 ， 
令 时 ) 。 


interval 


该 类 型 描述 了 一 个 时 间 段 的 长 度 ， 单 位 可 以 是 小 时 、 天 、 月 、 
分 钟 或 者 其 他 粒度 。 该 类 型 适用 于 对 日 期 和 时 间 进 行 数学 运算 的 场 
景 。 例 如 ， 假 设 从 现在 开始 666 天 之 后 世界 就 会 灭亡 ， 那 么 你 在 现 
在 的 时 刻 上 加 上 长 度 为 666 天 的 一 个 interval 类 型 值 ， 就 可 以 知 
道 世界 灭亡 的 准确 时 刻 。 





tsrange 


该 类 型 可 用 于 定义 timestamp with no timezone 的 开 区 间 
和 闭 区 间 。 访 类 型 包含 两 个 时 间 惟 以 及 开 区 间 和 闭 区 间 限 定 符 。 例 
如 ， '"[2612-61-61 14:66 2612-61-61 15:60)'::tsrange 定 
义 了 从 14:00 开始 到 15:00 之 前 结束 的 一 个 时 间 段 。 请 参考 
PostgreSQL 官方 手册 中 “区 间 类 型 ”一 节 以 了 解 更 多 信息 。 





tstzrange 


该 类 型 可 用 于 定义 timestamp with timezone 的 开 区 间 和 闭 
区 间 。 


daterange 

该 类 型 可 用 于 定义 日 期 的 开 区 间 和 闭 区 间 。 
5.3.1 时 区 详解 
PostgreSQL 中 有 众多 文 持 时 区 的 数据 类 型 ， 关 于 它们 有 一 个 常见 的 
误解 ， 就 是 认为 PostgreSQL 会 在 日 期 和 时 间 类 型 的 基础 上 额外 增 
加 一 个 标记 来 标识 时 区 。 这 种 理解 是 错误 的 。 如 果 你 存储 了 这 么 一 


个 带 时 区 的 信息 : 2612-2-14 18:68:66-8 (-8 代表 比 UTC 时 间 
迟 8 小 时 的 时 区 ) ，PostgreSQL 内 部 其 实 是 这 么 工作 的 : 











(1) 通过 计算 得 到 2012-02-14 18:08:00-8 代表 的 UTC 标准 时 间 ， 就 
是 2012-02-15 04:08:00-0; 


(2) 把 上 述 计算 得 到 的 UTC 标准 时 间 存 储 下 来 。 
当 你 回调 该 数据 以 用 于 显示 时 ，PostgreSQL 内 部 是 这 样 运作 的 : 


(1) 以 字段 内 容 中 指定 的 时 区 作为 后 续 计 算 的 基础 时 区 ， 如 未 指 
定 ， 则 用 数据 库 服务 器 上 配置 的 默认 时 区 ; 


(2) 计算 该 时 区 相对 于 UTC 标准 时 间 的 时 差 (对 于 
America/New_York 时 区 来 说 ， 与 UTC 的 时 差 是 -5 小 时 ) ，; 


(3) 根据 UTC 标准 时 间 和 时 区 的 时 差 计 算出 当地 时 间 (2012-02-15 
16:08:00 加 上 时 差 -5 小 时 后 得 到 2012-02-15 21:08:00) ，; 





(4) 显示 计算 结果 (2812-62-15 21:68:66 ) 。 


可 以 看 到 ，PostgreSQL 并 没有 存储 时 区 信息 ， 而 只 是 使 用 时 区 信息 
来 把 日 期 和 时 间 转 换 为 UTC 标准 时 间 再 存储 下 来 。 此 后 就 不 需要 
时 区 信息 了 。 当 PostgreSQL 需要 显示 该 日 期 时 间 信息 时 ， 它 会 按 
顺序 查找 当前 会 话 级 、 用 户 级 、 数 据 库 级 、 服 务 器 级 的 时 区 设置， 
然后 使 用 找到 的 第 一 个 时 区 来 将 UTC 标准 时 间 转 换 为 对 应 时 区 的 








时 间 值 后 再 显示 。 如 果 你 使 用 了 带 时 区 信息 的 数据 类 型 ， 请 务必 了 
解 将 服务 嚣 从 一 个 时 区 搬迁 到 为 一 个 时 区 的 后 果 。 假 设 你 的 数据 库 
服务 器 起 初 在 纽约 ， 然 后 你 将 其 数据 拿 到 洛杉矶 做 了 恢复 ， 那 么 所 
有 市 时 区 信息 的 日 期 和 时 间 数 据 看 起 来 都 会 不 一 样 了 。 这 在 看 起 来 
有 点 怪 ， 但 其 实 是 正常 的 ， 你 务必 要 预见 到 这 种 情况 的 发 生 。 


下 面 将 演示 一 个 时 区 处 理 不 当 导 致 问题 的 例子 。 假 设 麦 当 邢 公司 的 
服务 器 都 部 普 在 东海 兰 ， 服 务 器 中 记录 了 各 门店 的 开门 营业 时 间 ， 
并 且 是 用 timetz 格式 存储 的 。 然 后 旧金山 开 了 一 家 新 的 麦 当 芭 分 
店 ， 分 店 经 理 给 故 当 区 总 部 打 电 话 ， 要 求 把 新 店 的 信息 纳入 总 部 的 
管理 数据 库 ， 并 标记 其 开门 营业 时 间 为 早上 7 点 。 于 是 位 于 东海 羡 
的 数据 库 服 务 器 中 会 记录 下 该 分 店 的 营业 时 间 为 早上 7 点 ， 但 这 个 
时 间 转 换 到 旧金山 当地 时 区 却 是 凌晨 4 点 。 于 是 旧金山 很 多 早起 的 
人 就 会 很 奇怪 ， 为 什么 明明 说 是 凌晨 4 点 开门 却 到 了 时 间 还 没 营 

业 。 买 不 到 早点 是 小 事 ， 但 你 可 以 想象 这 三 小 时 的 时 差 能 导致 多 么 
大 的 混乱 ， 这 甚至 可 能 导致 人 命 关 天 的 问题 。 


看 了 上 面 的 例子 ， 你 可 能 会 问 : 既然 这 么 危险 ， 为 什么 还 要 使 用 带 
时 区 的 时 间 类 型 ? 原因 有 以 下 几 个 。 首 先 ， 这 些 类 型 能 够 自动 执行 
时 区 转换 ， 从 而 避免 了 繁琐 的 手工 劳动 。 例 如 ， 某 航空 公司 的 某 个 
航班 早上 8 点 从 波士顿 出 发 ，11 点 到 达 洛杉矶 ， 但 是 该 公司 的 数 
据 库 服务 器 位 于 欧洲 ， 如 果 这 些 时 间 入 库 时 都 要 手工 计算 时 差 后 再 
录入 ， 那 融 效 率 太 低 了 。 使 用 了 文 持 时 区 的 数据 类 型 后 ， 只 需 录 入 
带 时 区 信息 的 波士顿 和 洛杉矶 本 地 时 间 即 可 。 另 一 个 使 用 带 时 区 的 
数据 类 型 的 理由 是 其 能 够 自动 处 理 夏 令 时 。 世 界 各 国 对 于 夏令 时 的 
规定 五 化 八 门 ， 如 宋 东 个 数据 库 可 能 会 被 全 球 各 地 的 应 用 访问 ， 那 
么 就 需要 及 时 按照 最 新 的 全 球 夏 令 时 规定 来 更 新 库 中 的 时 间 信 息 。 
手动 跟踪 全 球 夏 令 时 的 变化 是 一 件 无 比 楷 琐 的 工作 ， 这 需要 一 个 全 
职 的 程序 员 来 专门 收集 各 国 的 夏令 时 安排 ， 并 在 前 述 数据 库 中 刷新 
这 些 国家 地区) 的 相关 时 间 数 据 。 


这 里 有 一 个 非常 有 趣 的 例子 : 一 位 出 差 中 的 销售 员 需 要 坐 飞机 回 
家 ， 起 点 是 旧金山 ， 终 点 是 奥克兰 附近 。 当 她 登 上 飞机 时 ， 当 地 时 
钟 显示 的 时 间 是 2012 年 3 月 11 日 凌晨 1 点 50 分 。 当 她 降落 时 ， 
当地 时 钟 显示 的 时 间 是 2012 年 3 月 11 日 凌晨 3 点 10 分。 那么 请 
问 这 段 旅程 共 花 了 多 长 时 间 ? 要 回答 这 个 问题 有 一 个 关键 点 ， 那 就 
是 在 这 段 飞 行 的 过 程 中 发 生 了 夏令 时 的 转换 ， 也 就 是 说 时 间 癌 前 跃 















































迁 了 。 如 果 使 用 了 带 时 区 信息 的 时 间 戳 ， 算 出 来 的 时 间 间 陋 就 是 
20 分 钟 ， 对 于 一 段 仅 仅 跨越 旧金山 海湾 的 短途 飞行 来 说 ， 这 个 答 


案 显 然 是 可 信 有 的。 如果 我 们 不 使 用 带 时 区 信息 的 数据 类 型 ， 一 定 会 
得 到 错误 的 答案 。 


SELECT '2612-63-11 3:16 AM America/Los Angeles'::timestamptz 
- "2612-63-11 1:56 AM America/Los Angeles'::timestamptz; 








以 上 查询 得 到 的 答案 是 20 分 钟 ， 然 而 以 下 查询 得 到 的 答案 却 是 1 
小 时 20 分 钟 。 


SELECT '206012-63-11 3:16 AM'::timestamp- "26012-63-11 1:56 AM'::timestam 





我 们 再 举 几 个 例子 来 把 这 个 问题 讲 得 更 透彻 一 些 。 如 示例 5-10 所 





示 ， 我 输入 时 使 用 的 是 带 时 区 的 洛杉矶 本 地 时 间 ， 但 由 于 数据 库 服 
务 器 位 于 波士顿 ， 所 以 查询 时 输出 的 时 间 是 带 时 区 信息 的 波士顿 本 
地 时 间 。 请 注意 ， 输 出 显示 附带 了 时 差 ， 这 是 没 问题 的 ， 与 我 原始 
录入 的 时 间 之 间 仪 仅 是 显示 差异 而 已 ， 在 数据 库 系 统 内 部 是 以 
UTC 标准 时 间 存 储 的 。 


示例 5-10 ”输入 时 使 用 的 是 一 个 时 区 的 本 地 时 间 ， 输 出 却 是 
为 一 个 时 区 的 本 地 时 间 














SELECT '28612-62-28 16:66 PM America/Los Angeles'::timestamptz; 


2012-602-29 681:6060:60-05 





在 示例 5-11 中 ， 我 们 要 求 返 回 的 古 不 市 时 区 的 时 间 惟 。 因 此 这 个 
Re 


示例 5-11 将 带 时 区 信息 的 时 间 惟 数据 转换 为 不 带 时 区 的 时 
间 恰 数据 


SELECT "26012-62-28 16:66 PM America/Los Angeles'::timestamptz 
AT TIME ZONE "Europe/Paris ' ; 


2012-62-29 67:06:66 





以 上 查询 其 实 回答 了 这 么 一 个 问题 ， 洛杉矶 本 地 时 间 2012-02-28 

10:00 p.m. 对 巴黎 来 说 是 当地 时 间 几 点 ?请 注意 ， 碍 询 结果 是 不 带 
相对 于 UTC 标准 时 间 的 时 差 的 。 另 外 请 注意 ， 可 以 通过 官方 名 称 
而 非 UTC 时 差 来 指定 一 个 时 区 ， 可 以 访问 维基 百科 来 查看 所 有 时 
区 的 官方 名 称 (http://en.wikipedia.org/wiki/Tz_database ) 。 


5.3.2 日 期 时 间 类 型 的 运算 符 和 函数 


时 间 间 隔 (interval ) 类 型 的 引入 极 大 简化 了 PostgreSQL 中 日 期 
和 时 间 类 型 的 数学 运算 过 程 。 如 果 没 有 interval 类 型 ， 我 们 就 得 
专门 创建 一 堆 函 数 来 实现 这 些 运算 功能 ， 很 多 其 他 数据 库 就 是 这 么 
干 的 。 通 过 interval 类 型 ， 可 以 使 用 我 们 很 熟悉 的 加 减 运算 符 对 
日 期 和 时 间 进 行 相 加 或 者 相 减 操作 。 下 面 的 例子 展示 了 可 用 于 日 期 
和 时 间 类 型 的 运算 符 和 函数 。 


相 加 运算 符 〈+ ) 可 以 在 一 个 时 间 类 型 值 上 加 上 一 段 时 间 间 隔 : 








SELECT "26012-62-16 11:66 PM'::timestamp + interval '1 hour 


2012-62-11 660:060:66 





你 也 可 以 将 两 个 interval 类 型 直接 相 加 ; 


SELECT '23 hours 26 minutes'::interval + '1 hour'::interval; 


24:20:00 





相 减 运算 符 〈- ) 可 以 从 一 个 时 间 类 型 值 中 减 去 一 段 时 间 间 隔 : 


SELECT "26012-62-16 11:66 PM'::timestamptz - interval '1 hour ; 


2012-602-16 22:060:060-65 





示例 5-12 中 展示 了 区 间 重 有 登 运算 符 OVERLAPS 的 用 法 ， 如 果 两 个 
参与 运算 的 时 间 段 有 重 著 ， 那 么 判定 结果 就 是 true 。 这 是 ANSI 
SQL 标准 中 规定 的 运算 符 ， 其 效果 等 价 于 overlaps 耳 

数 。OVERLAPS 谓词 运算 符 需 要 四 个 形 参 ， 前 两 个 是 第 一 个 时 间 段 
的 首尾 时 间 点 ， 后 两 个 是 第 二 个 时 间 段 的 首尾 时 间 点 。OVERLAPS 
运算 符 会 将 这 两 个 时 间 段 看 作 半 开 半 闭 区 间 ， 也 就 是 说 起 始 时 点 包 
含 在 时 段 内 ， 结 束 时 点 不 包含 在 时 段 内 。 这 与 BETWEEN 谓词 运算 
符 的 逻辑 是 不 一 样 的 ，BETWEEN 会 认为 起 始点 和 结束 点 都 是 包含 在 
区 间 内 的 。 只 要 你 设置 的 时 间 段 的 起 始 时 点 和 结束 时 点 不 相同 〈 如 
果 相 同 的 话 就 意味 着 时 间 段 长 度 为 0， 也 就 是 说 时 间 段 变 成 了 一 个 
时 间 点 ) ， 这 个 差异 就 不 会 造成 什么 问题 。 如 果 你 经 常 需 要 使 用 
OVERLAPS 运算 符 ， 请 务必 注意 这 一 点 。 


示例 5-12 “对 时 间 惟 和 日 期 类 型 使 用 OVERLAPS 运算 符 

















SELECT 
(`2012-16-25 16:66 AM' : :timestamp， '2612-160-25 2:66 PM'::timesta 
OVERLAPS 
(`2012-16-25 11:66 AM' : :timestamp，2612-10-26 2:66 PM'::timestam 
(`2012-16-25 ': :date，2612-16-26'::date) 
OVERLAPS 


( "2612-16-26'::date，2612-16-27'::date) As yj 





除了 普通 运算 符 和 谓词 运算 符 以 外 ，PostgreSQL 还 文 持 一 些 时 间 类 
型 的 函数 。 你 可 以 从 PostgreSQL 官方 手册 的 “日 期 和 时 间 类 型 的 相 
关 函 数 和 操作 ”一 节 中 碍 到 完整 的 函数 列表 ， 我 们 在 此 仅 演 示 一 个 
例子 。 


我 们 再 次 用 到 了 用 途 广 泛 的 generate_series 函数 。 你 可 以 对 日 


期 时 间 类 型 使 用 此 函数 ， 此 时 应 使 用 interval 类 型 值 作 为 步 长 。 


如 示例 5-13 所 示 ， 可 以 用 本 地 日 期 时 间 格 式 来 输入 日 期 ， 也 可 以 
使 用 在 国际 上 更 为 通用 的 ISO 格式 “yyyy-mm-dd” 来 输入 日 期 。 
PostgreSQL 会 自动 识别 不 同 的 输入 格式 。 为 保险 起 见 ， 我 们 倾向 于 
使 用 ISO 标准 格式 ， 因 为 在 不 同文 化 中 日 期 的 惯用 格式 是 不 一 样 
的 。 由 于 本 地 设置 的 差异 ， 在 数据 库 服务 器 之 间 甚 至 是 数据 库 实例 
之 间 也 会 存在 这 种 日 期 格式 差异 。 


， 5-13 ”使 用 generate_series() 函数 来 生成 时 间 序 列 
数组 

















SELECT (dt - interval '1 day')::date As eom 
FROM generate series('2/1/2812', '6/38/2812', interval '1 month') As d 


2012-604-360 
2012-65-31 





另 一 种 经 党 使 用 的 操作 束 是 从 日 期 和 时 间 类 型 的 数值 中 抽取 出 一 部 
分 。 在 PostgreSQL 中 ， 联 用 date part 和 to_char 函数 可 以 实现 
此 目标 。 示 例 5-14 中 除了 演示 这 两 个 函数 的 用 法 外 ， 还 演示 了 带 
时 区 信息 的 日 期 时 间 类 型 在 发 生 夏 令 时 变换 时 的 转换 逻辑 ， 为 此 我 
们 特地 挑选 了 一 个 美国 东部 时 区 (US/East ) 中 横 跨 夏令 时 变化 点 
的 时 间 段 。 夏 令 时 从 凌晨 2 点 生效 ， 因 此 该 表 的 最 后 一 行 束 是 夏令 
时 变化 以 后 的 新 时 间 。 


示例 5-14 ”从 日 期 时 间 类 型 中 提取 部 分 元 系 








SELECT dt, date part('hour',dt) As hr, to char(dt,'HH12:MI AM') As mn 
FROM 
generate_ series( 

"2012-63-11 12:36 AM ， 

"2012-63-11 3:66 AM ， 

interval '15 minutes 


dt | hr | mn 

ED TE | 
2612-63-11 60:36:60-65 | 8 | 12:36 AM 
2612-63-11 66:45:66-65 | 8 | 12:45 AM 
2612-63-11 61:66:66-65 | 1 | 61:66 AM 
2612-63-11 61:15:66-65 | 1 | 61:15 AM 
2612-63-11 61:36:66-65 | 1 | 81:36 AM 
2612-63-11 61:45:66-65 | 1 | 61:45 AM 
2612-63-11 63:66:60-64 | 3 | 863:66 AM 





generate_series 也 数 默认 生成 的 是 timesatamptz 类 型 的 数 
据 ， 需 要 显 式 转换 为 timestamp 类 型 。 


01. 5.4 数组 类 型 


数组 在 PostgreSQL 中 扮演 着 重要 的 角色 。 它 在 构造 聚集 函数 、 形 
成 IN 和 ANY 子 句 、 承 载 数据 类 型 转换 过 程 中 生成 的 中 间 值 等 领 
域 发 挥 着 重要 作用 。 在 PostgreSQL 中 ， 每 种 数据 类 型 都 有 相应 的 
以 其 为 基础 的 数组 类 型 。 如 果 你 自 定 义 了 一 个 数据 类 型 ， 那 么 
PostgreSQL 会 在 后 台 自 动 为 此 类 型 创建 一 个 数组 类 型 。 例 

如 ，integer 有 一 个 相应 的 整数 数组 类 型 integer[ ] 
，Character 也 有 相应 的 字符 数组 类 型 character[] ， 以 此 类 
推 。 下 面 将 展示 一 些 可 以 快速 构造 出 数组 的 函数 ， 可 以 免除 你 一 个 
个 元 素 录 入 的 贱 烦 。 此 外 还 有 一 些 用 于 管理 数组 的 函数 。 你 可 以 从 
PostgreSQL 官方 手册 的 “数组 函数 和 运算 符 ” 一 节 中 碍 到 全 部 的 数组 
函数 和 运算 符 列 表 。 


5.4.1 数组 构造 函数 
最 基本 的 构造 数组 的 方法 就 是 一 个 个 元 素 手 动 录入 ， 语 法 如 下 : 


SELECT ARRAY[2661，2662，2663] As yrs; 


如 果 数 组 元 素 存 在 于 一 个 查询 返 回 的 结果 集中 ， 那 么 可 以 使 用 这 个 
略 复杂 一 些 的 构造 函数 array() 来 生成 数组 : 











SELECT array( 
SELECT DISTINCT date part('year', log ts) 
FROM logs 


ORDER BY date part('year', log ts) 
); 





尽管 array 函数 仪 能 用 于 将 单字 有 段 的 查询 结果 和 集 转换 为 数组 ， 但 
你 依然 可 以 指定 一 个 复合 数据 类 型 作为 查询 结果 ， 这 种 情况 下 可 以 
获得 多 列 结 果 。5.8.6 节 会 演示 该 用 法 。 





你 可 以 把 一 个 直接 以 字符 串 格 式 书写 的 数组 转换 为 一 个 真正 的 数 
组 ;: 语法 如 下 


SELECT '{Alex,Sonia}'::text[] As name, '{46,43}'::smallint[] As age; 


{Alex, Sonia} | {46,43} 





你 还 可 以 用 string_to_array 函数 将 一 个 用 固定 分 阳 符 分 阳 的 字 
符 串 转换 为 数组 ， 如 示例 5-15 所 示 。 


示例 5-15 ”将 一 个 分 隔 符 格 式 的 字符 串 转换 为 数组 


SELECT string to array('ca.ma.tx', '.') As estados; 


{CA, MA, TX} 
(1 row) 





array_agg 是 一 种 聚合 函数 ， 它 可 用 于 将 一 组 任何 类 型 的 数据 转换 
为 数组 ， 如 示例 5-16 所 示 。 


示例 5-16 ”array_agg 函数 的 使 用 


SELECT array_agg(log ts ORDER BY log ts) As x 
FROM logs 
WHERE log ts BETWEEN "2611-61-61'::timestamptz AND '2611-61-15'::times 


{'2011-61-61',，'20611-61-13',，'2611-61-14'} 





在 PostgreSQL 9.5 中 ，array_agg 函数 新 增 了 支持 数组 型 数据 作为 
入 参 这 一 能 力 。 在 此 前 的 版 本 中 ， 如 果 你 试图 通过 array_agg 将 
一 批 数 组 聚合 为 二 维 数组 ， 它 会 报错 说 不 文 持 。array_agg 文 持 数 


组 型 入 参 这 一 能 力 使 得 根据 一 维 数组 构建 出 多 维 数组 成 为 一 件 很 容 
易 的 事情 ， 如 示例 5-17 所 示 。 


示例 5-17 根据 一 维 数组 构建 多 维 数组 


SELECT array_agg(f.t) 
FROM ( VALUES ('{Alex,Sonia}'::text[]), 
('{46,43}'::text[] ) ) As f(t); 


array_agg 


{{Alex,Sonia},{46,43}} 
(1 row) 





不 过 要 想 使 用 该 功能 ， 被 聚合 的 基础 数组 中 的 元 素 关 型 必须 相同 ， 
而 且 被 聚合 的 基础 数组 的 维度 必须 一 样 。 为 了 保证 这 一 点 ， 在 示例 
5-17 中 ， 我 们 对 其 中 的 年 龄 数组 做 了 类 型 转换 ， 统 一 为 text 。 力 
外 也 可 以 看 到 ， 上 面 例子 中 待 聚 合 的 基础 数组 中 的 元 素 个 数 都 是 相 
同 的 ;两 个 人 名 ， 两 个 年 龄 。 如 末 一 批 数 组 中 每 个 数组 的 内 部 元 系 
个 数 都 相同 ， 则 这 一 批 数 组 可 以 称 为 平衡 数组 。 


5.4.2 将 数组 元 素 展开 为 记录 行 


另外 一 个 常用 的 数组 操作 函数 是 unnest ， 通 过 它 可 以 将 数组 元 素 
纵向 展开 成 一 个 包含 若干 条 记录 的 结果 集 ， 如 示例 5-18 所 示 。 


示例 5-18 ”使 用 unnest 函数 将 数组 纵 同 展开 





SELECT unnest('{XOX,OXO,XOX}'::char(3)[]) As tic tac toe; 


tic tac toe 


XOX 
OXO 
XOX 





你 可 以 在 一 个 SELECT 语句 中 使 用 多 个 unnest 函数 ， 但 如 果 每 个 


unnest 展开 后 的 记录 行 数 不 一 致 ， 或 者 次 “对 不 齐 *， 那 么 得 到 的 
最 终结 果 将 是 这 些 结果 集 之 间 的 笛 卡 儿 积 ， 看 起 来 不 太 好 理解 。 


示例 5-19 演示 了 一 个 unnest 展开 后 可 对 齐 的 结果 集 ， 也 就 是 说 每 
个 unnest 都 输出 3 行 记 录 ， 最 终 连 接 成 的 记录 也 是 3 行 。 


示例 5-19 ”多 个 可 对 齐 数 组 的 展开 效果 





SELECT 
unnest('{three,blind,mice}'::text[]) As t, 
unnest('{1,2,3}'::smallint[]) As i; 


three |1 
blind |2 
mice |3 





如 果 你 从 上 述 一 个 数组 中 拿 掉 一 个 元 素 ， 那 么 两 个 数组 的 元 素 就 无 
法 对 齐 了 ， 此 时 展开 得 到 的 结果 如 示例 5-20 所 示 。 


示例 5-20 ”多 个 无 法 对 齐 的 数组 展开 后 的 效果 


SELECT 
unnest( '{blind,mouse}'::varchar[]) As v, 
unnest('{1,2,3}'::smallint[]) As i; 





PostgreSQL 9.4 中 ，unnest 子 数 文 持 了 多 个 入 参 ， 该 函数 会 在 数组 
不 平衡 的 位 置 1 填 入 空 值 null 。 新 的 unnest 的 主要 缺点 是 ， 它 


只 能 用 在 FROM 子 句 中 。 示 例 5-21 使 用 了 刚刚 介绍 过 的 PostgreSQL 
新 支持 的 unnest ， 重 新 展开 了 示例 5-20 中 展开 过 的 不 平衡 数 
组 。 

















1 如 果 某 个 数组 相对 其 他 数组 来 说 元 素 个 数 少 ， 则 缺少 的 那些 元 素 的 位 置 就 是 不 平衡 的 
位 置 。 一 一 译 者 注 








示例 5-21 使 用 支持 多 入 参 的 unnest 展开 不 平衡 数组 


SELECT * FROM unnest('{blind,mouse}'::text[], '{1,2,3}'::int[]) AS f(t 


<NULL> 





5.4.3 ”数组 的 拆 分 与 连接 
PostgreSQL 支持 使 用 start :end 语法 对 数组 进行 拆 分 。 操 作 结 果 


古 原 数组 的 一 个 子 数组 。 例 如 ， 如 果 要 得 到 一 个 仪 包含 当前 数组 第 
2 个 至 第 4 个 元 素 的 新 数组 ， 可 以 使 用 以 下 语法 : 


SELECT fact subcats[2:4] FROM census.lu fact types; 


如 采 要 将 两 个 数组 连接 到 一 起 ， 可 以 使 用 连接 运算 符 | | : 


SELECT fact subcats[1:2] || fact subcats[3:4] FROM census.lu fact type 


可 以 通过 下 面 的 语法 来 为 一 个 现 有 数组 添加 元 素 : 


SELECT '{1,2,3}'::integer[] || 4 |1| 5; 


得 到 的 结果 是 {1,2,3,4,5} 。 
5.4.4 引用 数组 中 的 元 素 


一 般 来 说 ， 我 们 会 通过 数组 下 标 来 引用 数组 元 素 ， 请 特别 注意 
PostgreSQL 的 数组 下 标 从 1 开始。 如果 你 试图 越界 访问 一 个 数组 ， 
也 就 是 说 数组 下 标 已 经 超过 了 数组 元 素 的 个 数 ， 那 么 不 会 返回 错 
误 ， 而 是 会 得 到 一 个 空 值 NULL 。 下 面 的 例子 演示 了 获取 数组 的 第 
一 个 和 最 后 一 个 元 素 的 方法 : 














SELECT 
fact subcats[1] As primero, 
fact_ subcats[array _ upper(fact subcats, 1)] As segundo 


FROM census.lu fact types; 





我 们 使 用 array_upper 函数 来 获取 数组 元 素 的 个 数 ， 该 函数 的 第 
二 个 必 选 入 参 表示 数组 的 维度 。 在 本 例 中 ， 数 组 是 一 维 的 ， 但 
PostgreSQL 文 持 多 维 数 组 。 


5.4.5 ”数组 包含 性 检查 


PostgreSQL 支持 多 种 数组 类 型 的 运算 符 。 前 面 已 经 见 过 了 连接 运算 
符 (|| ) ， 它 可 以 将 多 个 数组 合并 为 一 个 ， 也 可 以 为 现 有 数组 添 
加 新 元 素 ， 详 见 5.4.3 节 。 此 外 ， 数 组 类 型 的 运算 符 还 有 = 、《> 
、<、> 、@> 、<@ 以 及 && 。 这 些 运算 符 要 求 两 边 数 组 的 数据 类 型 
相同 。 如 果 你 在 数组 类 型 的 字段 上 建立 了 GiST 或 者 GIN 索引 ， 那 
么 这 些 运算 符 可 以 用 上 索引 。 

重 赫 判定 运算 符 〈&& ) 的 作用 是 : 如 果 两 个 数组 有 任何 共同 的 元 
素 ， 则 返回 true ; 否则 返回 false 。 示 例 5-22 将 查 出 我 们 表 中 
所 有 满足 “fact_subcats 数组 字段 中 含有 OCCUPANCY STATUS 或 
者 是 For rent 这 两 个 值 中 的 一 个 ”这 一 条 件 的 记录 。 


示例 5-22 ”数组 重 若 判定 运算 符 


SELECT fact_subcats 
FROM census.1lu_ fact types 











WHERE fact_subcats && '{OCCUPANCY STATUS ,For rent}'::varchar[]; 


fact_subcats 


{S61,，"OCCUPANCY STATUS"，"Total housing units"...} 
{S82,"OCCUPANCY STATUS","Total housing units"...} 
{S83,"OCCUPANCY STATUS","Total housing units"...} 
{S160,"VACANCY STATUS","Vacant housing units","For rent"...} 
(4 rows) 





只 有 当 两 个 数组 中 的 所 有 元 素 及 其 排列 顺序 都 完全 相同 时 ， 等 值 判 

定 运算 符 (= ) 才 会 返回 true 。 如 果 你 并 不 关心 两 个 数组 的 元 素 

顺序 是 否 完全 相同 ， 只 是 想 知 道 一 个 数组 中 的 元 素 集合 是 否 是 另 一 

个 数组 的 子 集 ， 可 以 使 用 包含 关系 判定 运算 符 〈@> 、<@ ) 。 示 例 

5-23 中 演示 了 包含 〈@> ) 和 被 包含 (<@ ) 这 两 个 运算 符 的 区 别 。 
示例 5-23 ”数组 包含 关系 判定 运算 符 


SELECT '{1,2,3}'::int[] @> '{3,2}'::int[] AS contains; 


contains 


(1 row) 
SELECT '{1,2,3}'::int[] <@ '{3,2}'::int[] AS contained_ by; 


contained by 





01. 5.5 区 间 类 型 


区 间 数 据 类 型 可 以 表达 一 个 带 有 起 始 值 和 结束 值 的 值 区 间 。 
PostgreSQL 为 区 间 类 型 所 供 了 很 多 配套 的 运算 符 和 函数 ， 例 如 判定 
区 间 是 否 重 登 ， 判 定 茶 个 值 是 个 落 在 区 间 内 ， 以 及 将 相 邻 的 右 干 区 
间 合 并 为 一 个 完整 的 区 间 等 。 在 出 现 区 间 类 型 之 前 ， 类 似 操作 只 能 
通过 写 函 数 实 现 ， 这 种 操作 很 楷 琐 ， 不 仅 低 效 而 且 很 容易 出 错 ， 并 
且 写 出 的 函数 不 一 定 能 达到 预想 的 效果 ， 在 对 于 时 间 类 型 的 操作 中 
无 其 如 此 。 在 我 们 目 己 的 项 目 中 ， 我 们 在 所 有 需要 表示 时 间 范 围 的 
表 中 都 用 上 了 区 间 类 型 ， 事 实证 明 效果 很 好 。 我 们 希望 你 也 能 分 享 
我 们 这 一 成 功 经 验 。 


有 了 区 间 类 型 后 ， 就 不 再 需要 用 两 个 字段 来 定义 一 个 区 间 。 假 设 我 
们 而 望 定义 一 个 大 于 等 于 -2 小 于 2 的 整数 区 间 ， 该 区 间 的 写法 是 
[-2,2) ， 左 边 中 括号 表示 左边 是 财 区 间 ， 即 值 域 包含 -2; 右边 小 
括号 表示 右边 是 开 区 间 ， 即 值 域 不 包含 2。 那 么 [-2,2) 这 个 整数 
区 间 包 含 的 元 素 有 : -2，-1，0，1。 类 似 地 ， 可 以 知道 以 下 整数 区 
间 所 包含 的 元 系 。 


。 整数 区 间 (-2,2] 含 四 个 元 素 : -1、6、1、2。 
。 整数 区 间 (-2,2) 含 三 个 元 素 : -1、686 、1。 
。 整数 区 间 [-2,2] 含 五 个 元 素 : -2、-1、6、1、2。 


5.5.1 离散 区 则 和 连续 区 间 


PostgreSQL 对 离散 区 间 和 连续 区 间 是 区 别 对 竺 的。 整数 类 型 或 者 日 
期 类 型 的 区 间 是 离散 区 间 ， 因 为 区 间 内 每 一 个 值 都 是 可 以 被 枚 举 出 
RS 
值 有 无 限 多 。 


一 个 离散 区 间 有 多 种 表示 方法 ， 比 如 前 面 提 到 的 [-2,2) 这 个 例 
子 ， 它 就 可 以 换 用 多 种 写法 而 且 每 种 方式 的 效果 完全 一 

样 : [-2,1] 、(-3,1] 、(-3,2) 和 [-2,2) 。 这 四 种 写法 中 ， 
PostgreSQL 规定 [-2,2) 为 规范 写法 ， 并 不 是 因为 这 种 写法 有 什么 
优势 ， 仪 仅 是 因为 统一 后 有 利于 运算 ， 不 用 每 次 计算 时 都 得 先 考虑 
是 开 区 间 还 是 财 区 间 这 件 事 。PostgreSQL 会 自动 对 所 有 的 离散 区 间 
























































进行 规范 化 ， 不 管 是 存储 还 是 显示 时 都 会 这 么 做 。 因 此 ， 如 果 你 输 
入 了 一 个 时 间 区 间 (2614-1-5,2614-2-1] ， 那 么 PostgreSQL 会 
自动 把 它 改写 为 [2614-61-66,2614-62-62) 。 

5.5.2 原生 文 持 的 区 间 类 型 


PostgreSQL 原生 文 持 六 种 区 间 类 型 ， 都 是 关于 数字 型 和 日 期 时 间 型 
的 。 


int4range、int8range 


这 是 整数 型 离散 区 间 ， 其 定义 符合 前 闭 后 开 的 规范 化 要 求 。 





numrange 


这 是 连续 区 间 ， 可 以 用 于 描述 小 数 、 泽 点 数 或 者 双 精 度数 字 的 
区 间 。 





daterange 


这 是 不 带 时 区 信息 的 日 期 离散 区 间 。 





tsrange、 tstzrange 


这 是 时 间 惟 “日 期 加 时 间 ) 类 型 的 连续 区 间 ， 秘 值 部 分 文 持 小 
数 。tsrange 不 带 时 区 信息 ，tstzrange 带 时 区 信息 。 


对 于 数字 类 型 的 区 间 来 说 ， 如 果 区 间 的 起 点 值 或 者 终点 值 未 指定 ， 
那么 PostgreSQL 会 自动 为 其 填 入 null 值 。 理 论 上 讲 ， 你 可 以 将 该 
null 解释 为 代表 左 侧 的 -infinity 〈 负 无 穷 ) 或 右 侧 的 
infinity 〈 正 无 穷 ) 。 实 际 上 ， 你 会 受 限 于 特定 数据 类 型 的 最 小 
值 和 最 大 值 。 比 如 对 于 int4range 数据 类 型 来 说 ， 区 间 (,) 实际 
上 代表 的 是 [-2147483648 ,2147483647) 。 


对 于 时 间 类 型 的 区 间 来 说 ，-infinity 和 infinity 就 是 有 效 的 上 
限 和 下 限 。 


除了 系统 原生 文 持 的 区 间 类 型 外 ， 你 还 可 以 自 定 义 区 间 类 型 ， 可 以 








设 定 为 离散 区 间 也 可 以 设 定 为 连续 区 间 。 
5.5.3 ”定义 区 间 的 方法 


任何 类 型 的 区 间 都 是 由 相同 数据 类 型 的 起 点 值 和 终点 值 外 加 表示 区 
间 开 闭 的 符号 [、] 、(、) 构成 的 ， 如 示例 5-24 所 示 。 


示例 5-24 ”使 用 类 型 转换 的 方法 来 定义 区 间 


[2613-61-65,2613-68-13] ' ::daterange; @O@ 
(2613-61-65,2613-68-13] ' ::daterange; @ 
'(0,)'::int8range; © 

'(2613-61-65 16:66,2613-68-13 14:66]'::tsrange; @ 


[2613-61-65,2613-68-14) 
[2613-61-66,2613-68-14) 

[1,) 

("2613-61-65 10:60:6060","206013-68-13 14:66:66"] 





@ 定义 了 一 个 从 2013-01-05 到 2013-08-13 的 日 期 型 闭 区 间 。 请 注 
意 此 处 区 间 终 点 的 写法 是 不 规范 的 。 


四 定义 了 一 个 从 2013-01-05 到 2013-08-13 的 日 期 型 半 开 半 闭 区 
间 。 请 注意 此 处 区 间 起 点 和 终点 的 写法 都 是 不 规范 的 。 


@ 定 义 了 一 个 大 于 0 的 整数 区 间 。 请 注意 此 处 区 间 起 点 的 写法 是 
不 规范 的 。 


四 定义 了 一 个 从 2013-01-05 10:00 AM 到 2013-08-13 2 PM 的 半 开 
半 闭 连续 区 间 。 





和 PostgreSQL 中 的 日 期 时 间 类 型 可 以 用 -infinity 表示 负 
无 穷 , 用 infinity 表示 正 无 穷 。 为 了 与 传统 写法 保持 一 致 ， 
建议 以 约定 俗 成 的 “前 财 后 开 ? 方 式 来 书写 时 间 范 围 ， 即 区 间 起 
点 使 用 左 中 括号 “[ ”， 区 间 终 点 使 用 右 小 括号 “) >”， 比 如 [ - 
infinity，intifinity) 。 





区 间 也 可 以 使 用 区 间 构 造 函 数 来 定义 ， 该 构造 函数 的 名 称 与 区 间 类 
型 名 称 是 一 致 的 ， 可 以 输入 两 个 或 者 三 个 参数 。 丰 例如 下 : 


SELECT daterange('206013-061-865','infinity','[]'); 





第 三 个 参数 是 区 间 边 界 开 闭 标识 符 ， 如 果 不 填 则 默认 为 前 开 后 闭 
[) 。 为 清晰 起 见 ， 建 议 你 总 是 显 式 指定 该 参数 ， 因 为 其 默认 值 不 
征 那 种 非常 显而易见 的 值 ， 容 易 被 记 错 。 


5.5.4 定义 含 区 间 类 型 字段 的 表 


时 间 类 型 区 间 是 很 常用 的 ， 假 设 你 有 一 张 employment 表 ， 表 中 存 
储 了 公司 聘请 雇员 的 历史 记录 。 你 可 以 像 示例 5-25 那样 用 时 间 区 
间 来 定义 一 个 员工 在 公司 的 服务 年 限 ， 而 不 需要 用 起 始 时 间 和 结束 
时 间 两 个 单独 的 字段 来 表示 。 在 示例 5-25 中 ， 我 们 给 period 列 添 
加 了 一 个 索引 ， 以 使 用 我 们 的 区 间 列 加 速 碍 询 。 


示例 5-25 ”建立 一 个 带 有 日 期 区 间 类 型 字段 的 表 











CREATE TABLE employment (id serial PRIMARY KEY, employee varchar(26)， 
period daterange ) ; 

CREATE INDEX ix_employment period ON employment USING gist (period);© 
INSERT INTO employment (employee,period) 

VALUES 


('Alex','[20612-64-24, infinity)'::daterange), 
('Sonia','[2611-64-24, 2612-66-061)'::daterange)，, 
('Leo','[28612-66-20, 2613-64-20)'::daterange)，, 
('Regina','[20612-66-206, 26013-64-20)'::daterange); 





@ 在 区 间 字 段 上 建立 一 个 GiST 索引 。 
5.5.5 ”适用 于 区 间 类 型 的 运算 符 
区 间 类 型 上 用 得 最 多 的 两 个 运算 符 是 重 辣 运算 符 (&& ) 和 包含 运 


算 符 (@> ) 。 接 下 来 将 对 这 两 个 运算 符 进 行 介绍 。 要 了 解 区 间 运 
算 符 的 完整 列表 ， 请 参考 PostgreSQL 官方 手册 中 的 “区 间 类 型 运算 














顾名思义 ， 车 判定 运算 符 && 的 作用 就 是 判定 两 个 区 间 是 人 否 
有 重 登 部 分 0 true ， 人 个 则 返回 false 。 示例 : 5- 
26 Be 其 中 还 使 用 了 string_agg 函数 
将 雇员 名 单列 表 合并 成 一 个 文本 字段 。 


示例 5-26 ”查询 谁 与 准 曾 经 同时 在 公司 工作 过 


SELECT 


el.employee, 
string agg(DISTINCT e2.employee, ', ' ORDER BY e2.employe 
FROM employment As el INNER JOIN employment As e2 
ON el1.period && e2.period 
WHERE el1.employee 《> e2.employee 
GROUP BY el1.emp1loyee; 


employee | colleagues 
tt a i 
| Leo, Regina, Sonia 
| Alex, Regina 

Regina Alex, Leo 

Sonia 





b. 包含 与 被 包含 关系 运算 符 


对 于 包含 关系 运算 符 @> 来 说 ， 第 一 个 参数 是 区 间 ， 第 二 个 参 
数 是 待 判 定 的 值 。 如 果 第 二 个 参数 的 值 沙 在 第 一个 参数 的 区 间 
内 ， 运 算 符 就 返回 true ， 和 否则 返回 false 。 示 例 5-27 演示 
了 其 用 法 。 


示例 5-27 查询 当前 还 在 公司 工作 的 雇员 名 单 





SELECT employee FROM employment WHERE period @> CURRENT_ DATE GROU 


employee 





<@ 是 用 于 判定 被 包含 关系 是 否 成 立 的 运算 符 ， 它 的 第 一 个 参 
数 是 待 判定 的 值 ， 第 二 个 参数 是 区 间 ， 其 用 法 与 包 关 系 z 算 
符 完全 一 致 ， 不 再 交 述 


01. 5.6 ”JSON 数 据 类 型 


PostgreSQL 文 持 JSON 数据 类 型 并 提供 了 很 多 相关 的 函数 。JSON 
已 成 为 Web 开发 领域 最 流行 的 数据 传递 格式 。PostgreSQL 9.3 中 针 
对 JSON 类 型 做 了 显著 的 功能 增强 ， 新 增 了 一 些 用 于 实现 子 树 抽 
取 、 内 容 编辑 以 及 与 其 他 数据 类 型 进行 互 转 的 操作 函数 。 
PostgreSQL 9.4 中 引入 了 JSONB 数据 类 型 ， 该 类 型 是 JSON 类 型 的 
二 进 制版 本 ， 它 与 JSON 类 型 最 主要 的 差别 是 JSONB 可 以 文 持 索 
引 而 JSON 不 能 (只 能 使 用 非常 受 限 制 的 函数 索引 ) 。PostgreSQL 
9.5 中 为 JSONB 类 型 引入 了 更 多 的 文 持 函数 ， 包 括 可 用 于 修改 
jsonb 对 象 中 的 子 元 素 的 函数 。PostgreSQL 9.6 中 引入 了 
josnb_insert 函数 ， 可 以 实现 往 一 个 现 有 的 jsonb 对 象 中 插入 数 
据 ， 即 支持 往 JSONB 内 部 的 数组 对 象 中 增加 新 元 素 ， 也 可 以 实现 
在 JSONB 内 部 增加 一 个 新 的 键 值 对 。 


5.6.1 插入 JSON 数 据 


要 想 在 表 中 存储 JSON 数据 ， 只 需 建 一 个 json 类 型 的 字段 即 可 ， 
语法 如 下 : 


CREATE TABLE persons (id serial PRIMARY KEY, person json); 


示例 5-28 的 语句 同 表 中 插入 了 一 条 JSON 记录 。PostgreSQL 会 自 
动 对 插入 的 JSON 文本 进行 格式 检查 以 确保 其 格式 合法 。 请 注意 ， 
无 法 将 无 效 的 JSON 字符 串 存 储 到 某 个 JSON 列 中 ， 而 且 也 没有 什 
么 办 法 可 以 把 无 效 的 JSON 字符 串 转 换 为 JSON 类 型 。 


示例 5-28 插入 一 个 JSON 字段 








INSERT INTO persons (person) 
VALUES ( 
'{ 
"name":"Sonia", 
"spouse": 


"name":"Alex", 
"parents": 


"father":"Rafael", 
"mother":"0Ofelia" 


}， 
"phones": 
[ 
{ 
"type":"work", 
"number":"619-722-6719" 
}， 
{ 
"type":"cell", 
"number":"619-852-50683" 
} 
] 
}， 
"children": 
[ 
{ 
"name":"Brandon", 
"gender™":"M" 
}， 
{ 
"name":"Azaleah",， 
"girl":true, 
"phones": [|] 
} 
] 





5.6.2 ”查询 JSON 数 据 


要 想 对 JSON 数据 的 层次 化 结构 进行 访问 ， 最 简单 的 方法 就 是 使 用 
路 径 指向 符 。 示 例 5-29 演示 了 一 些 常见 的 用 法 。 


示例 5-29 ”查询 JSON 字段 





SELECT person->'name' FROM persons ; 
SELECT person->'spouse'->'parents'->'father' FROM persons ; 


也 可 以 通过 路 径 数 组 的 形式 进行 查询 ， 如 下 例 所 示 : 


SELECT person#>array['spouse','parents','father'] FROM persons; 


注意 ， 如 果 查 询 语句 中 使 用 了 路 径 数 组 ， 前 面 必 须 用 #> 指 同 符 。 
可 以 通过 指定 下 标 来 访问 JSON 内 部 数组 的 某 个 特定 元 素 。 请 注 
意 ，JSON 数组 的 起 始 元 素 下 标 与 PostgreSQL 数组 类 型 不 同 ， 前 者 
从 0 开始 ， 后 者 从 1 开始。 


SELECT person->'children'->60->'name' FROM persons; 


上 面 这 句 话 用 路 径 数组 语法 来 表达 就 是 : 


SELECT person#>array['children','0','name'] FROM persons; 


上 面 的 这 些 例子 中 ， 碍 询 返 回 的 数据 类 型 都 是 JSON 内 部 元 素 的 基 
础 类 型 〈 数 字 、 字 符 串 、 布 尔 值 ) 。 如 果 和 希望 返回 的 值 都 统一 转换 
为 文本 型 ， 那 么 只 珊 在 路 径 指 同 符 中 再 增加 一 个 > 符 即 可 : 


SELECT person->'spouse'->'parents'->>'father' FROM persons; 
SELECT person#>>array['children','0','name'] FROM persons ; 








可 以 看 到 ， 如 果 联 用 多 个 -> 指 同 符 ， 只 需 把 最 后 一 个 指 问 符 改写 
为 ->> 即 可 。 


json_array_elements 函数 的 入 参 是 一 个 JSON 数组 ， 该 函数 会 
将 该 JSON 数组 中 的 每 个 元 素 拆 成 单独 一 行 输出 ， 如 示例 5-30 所 
示 。 


示例 5-30 用 json_array_elements 函数 展开 JSON 数组 


SELECT json array elements(person->'children')->>'name' As name FROM p 


(2 rows) 





A JSON 类 型 本 质 上 表达 了 层次 化 结构 的 树 型 数据 ， 当 需 
要 访问 树 上 的 元 素 时 ， 强 烈 建议 你 使 用 指 同 符 语 法 。 该 语法 非 
常 简洁 ， 而 且 对 JSONB 类 型 也 适用 《〈 稍 后 将 介绍 JSONB 类 
型 ) 。PostgreSQL 提供 了 一 个 功能 与 指 回 符 语 法 对 等 的 函数 
json_extract_path ， 该 函数 可 以 接受 不 定 长 入 参 〈 也 就 是 
说 该 函数 的 入 参 个 数 可 以 无 限 多 ) 。 第 一 个 参数 是 待 访问 的 
JSON 对 象 ， 后 续 参数 就 是 层次 化 访问 路 径 上 每 一 层 的 key 
值 。->> 运算 符 也 有 一 个 功能 完全 对 等 的 函数 ， 名 为 
json_extract_path _ text ， 其 用 法 不 再 歼 述 。 


5.6.3 ”输出 JSON 数 据 


PostgreSQL 除了 可 以 查询 库 中 已 有 的 JSON 数据 外 ， 还 文 持 将 别 的 
数据 类 型 转换 为 JSON 类 型 。 接 下 来 的 例子 将 演示 系统 内 置 的 
JSON 转换 函数 的 用 法 ， 这 类 函数 可 以 将 其 他 数据 类 型 转换 为 
JSON 类 型 。 


示例 5-31 中 将 使 用 row_to_json 函数 将 示例 5-28 中 导入 的 数据 
的 部 分 字段 转换 为 JSON 数据 。 


示例 5-31 ”将 多 条 记录 转换 为 单个 JSON 对 象 (PostgreSQL 
9.3 及 之 后 的 厂 本 才 文 持 该 语句 ) 








SELECT row to json(f) As x 
FROM ( 

SELECT id, json array_elements(person->'children')->>'name' As cna 
) As f; 


{"id":1,"cname":"Brandon"} 
{"id":1,"cname":"Azaleah"} 
(2 rows) 





如 果 要 将 persons 表 中 的 所 有 记录 行 整体 打包 转换 为 一 个 JSON 
对 象 ， 可 以 使 用 以 下 语法 : 


SELECT row to json(f) As jsoned row FROM persons As f; 


“查询 时 将 一 行 记录 作为 单个 字段 输出 ”这 种 功能 只 有 PostgreSQL 
才 支 持 。 该 功能 对 于 创建 复合 JSON 对 象 特别 有 用 。 我 们 将 在 
7.2.12 节 中 深入 讨论 此 特性 ， 并 且 将 在 示例 7-20 中 演示 如 何 使 用 
array_agg 和 array_to_json 函数 将 多 条 记录 转换 为 一 个 JSON 
对 象 后 输出 。9.3 版 新 增 了 对 json_agg 函数 的 支持 ， 示 例 7-21 中 
将 演示 该 函数 的 用 法 。 


5.6.4 JSON 类 型 的 二 进 制 版 本 : jsonb 


PostgreSQL 9.4 中 引入 了 新 的 jsonb 数据 类 型 。 该 类 型 使 用 的 运算 
符 与 json 类 型 完全 相同 ， 该 类 型 的 处 理 函 数 与 json 类 型 的 处 理 
函数 一 一 对 应 ， 仅 在 命名 上 略 有 差别 〈 前 者 以 *jsonb” 开 汰 ， 后 者 
以 “json” 开 头 ) ， 另 外 jsonb 类 型 还 比 json 类 型 多 了 一 些 新 的 函 
数 。 由 于 jsonb 类 型 的 数据 在 存 入 库 中 时 经 过 了 预 解 析 ， 因 此 在 
处 理 过 程 中 无 须 再 次 进行 文本 解析 ， 所 以 其 处 理性 能 远 超 json 类 
型 。jsonb 数据 类 型 和 json 数据 类 型 的 关键 区 别 如 下 所 示 。 


。json 是 以 原始 文本 格式 存储 的 ， 而 jsonb 存储 的 是 原始 文本 
解析 以 后 生成 的 三 进 制 数据 结构 ， 该 二 进 制 结构 中 不 再 保存 原 
台 文 本 中 的 空格 ， 存 储 下 来 的 数字 的 形式 也 发 生 了 一 定 的 变 
化 ， 并 且 对 其 内 部 记录 属性 值 进行 了 排序 。 例 如 ， 文 本 中 的 
e-5 这 种 数字 会 被 转换 为 对 应 的 小 数 存 储 。 

。 jsonb 不 允许 其 内 部 记录 的 键 值 重 复 ， 如 果 出 现 重 复 则 会 从 中 

















自动 选择 一 条 ， 其 余 的 重复 记录 会 被 丢弃 ， 但 json 类 型 中 记 
录 键 值 重复 是 允许 的 。Michael Paquier 的 博文 “Manipulating 
jsonb data by abusing of key uniqueness” 中 演示 了 若干 例子 。 

。 jsonb 类 型 的 字段 上 可 以 直接 建立 GIN 索引 《该 类 索引 在 6.3 
节 中 有 相关 介绍 ) ， 但 json 类 型 字段 上 却 只 能 建立 函数 过 
ee JSON 的 字符 串 中 提取 出 具体 字 
-又 o 


为 了 说 明 以 上 概念 ， 我 们 另外 新 建 一 张 与 前 面 persons 结构 类 似 
的 persons 表 ， 只 不 过 这 次 用 的 是 jsonb 类 型 : 


CREATE TABLE persons b (id serial PRIMARY KEY, person jsonb); 


重复 执行 示例 5-28 的 步骤 ， 往 新 表 中 插入 记录 。 


目前 为 止 还 没 体现 出 JSON 和 JSONB 的 差别 ， 但 在 对 两 张 表 分 别 
执行 查询 时 就 能 看 出 来 了 。 为 了 让 JSONB 类 型 的 二 进 制 字段 值 能 
够 显示 ，PostgreSQL 会 自动 将 其 转换 为 规范 化 的 文本 表示 形式 ， 如 
示例 5-32 所 示 。 


示例 5-32 ”JSONB 与 JSON 类 型 输出 格式 对 比 




















SELECT person As b FROM persons b WHERE id = 1; © 
SELECT person As j FROM persons WHERE id = 1; 名 


{ "name": "Sonia", 

"spouse": { "name": "Alex", "phones": [{"type": "work", "number": "619- 
{"type": "cell", "number": "619-852-56083"}]， 

"parents": {"father": "Rafael", "mother": "Ofelia"}}, 


"children": [{"name": "Brandon", "gender": "M"}, 
{"girl": true, "name": "Azaleah", "phones": []}]} 
(1 row) 

j 
{ 


"name":"Sonia", 
"spouse": 


{ 


"name":"Alex", 
"parents": 
{ 
"father":"Rafael", 
"mother":"Ofelia" 


}， 
"phones": 
[ 
{ 
"type":"work", 
"number":"619-722-6719"+ 
}， 
{ 
"type":"cell", 
"number":"619-852-506083"+ 
} 
] 
}， 
"children": 
{ 
"name":"Brandon", 
"gender":"M" 
}， 
{ 
"name":"Azaleah",， 
"girl":true, 
"phones": [] 
} 


(1 row) 





@@ 可 以 看 出 ，jsonb 类 型 的 输出 是 对 输入 的 内 容 进 行 了 重新 格式 
化 ， 并 删 掉 了 输入 时 文本 中 的 空白 。 此 外 ， 插 入 记录 时 属性 字段 的 


顺序 信息 是 不 保留 的 。 


@ json 类 型 的 输出 保持 了 输入 时 的 原样 ， 包 括 原文 本 中 的 空白 以 
及 属性 字段 的 顺序 。 


jsonb 与 json 的 处 理 函 数 一 一 对 应 ， 但 函数 名 略 有 不 同 ， 而 且 
jsonb 比 json 多 了 一 些 处 理 函 数 。 例 如 ，Jjson 适用 的 
json_extract_path_text 和 json_each 函数 对 应 于 jsonb 适用 








的 jsonb_extract_path_text 和 jsonb_each 函数 。 二 者 的 运算 
符 完全 相同 ， 因 此 如 果 想 把 5.6.2 节 的 示例 改造 为 适用 jsonb 类 
型 ， 只 需 把 表 名 蔡 换 一 下 ， 然 后 把 json_array elements 替换 为 


jsonb_array_elements 即 可 。 


jsonb 比 json 多 文 持 的 运算 符 有 以 下 几 个 : 等 值 判定 运算 符 〈= 
) 、 包 含 关系 判定 运算 符 (@> ) 、 被 包含 关系 判定 运算 符 (<@ 

) 、 键 值 存 在 判定 运算 符 〈? ) 、 判 定 一 组 键 值 中 是 否 有 任意 一 个 
已 存在 的 运算 符 (?| ) ， 以 及 判定 一 组 键 值 中 的 每 一 个 是 否 均 已 
存在 的 运算 符 (?& ) 。 


假设 要 列 出 所 有 孩子 姓名 为 “Brandon” 的 人 员 名 单 ， 就 可 以 使 用 包 
含 关 系 判 定 运算 符 ， 如 示例 5-33 所 示 。 


示例 5-33 JSONB 包含 关系 运算 符 的 使 用 








SELECT person->>'name' As name 
FROM persons_b 
WHERE person @> '{"children":[{"name":"Brandon"}]}'; 





如 果 在 jsonb 列 上 创建 了 GIN 索引 ， 那 么 前 述 这 几 个 运算 符 的 操 
作 速 度 是 极 快 的 : 


CREATE INDEX ix persons jb person gin ON persons b USING gin (person); 


我 们 演示 用 的 这 些 表 都 很 小 ， 因 此 规划 器 可 能 会 选择 走 全 表 扫 擂 而 
不 是 走 索 引 查 询 ， 但 如 果 有 更 多 的 记录 ， 示 例 5-33 中 这 种 语句 是 
一 定 会 用 上 索引 的 。 

5.6.5 ”编辑 JSONB 类 型 的 数据 


PostgreSQL 9.5 中 为 了 支持 对 JSONB 类 型 的 数据 进行 修改 ， 引 入 了 











原生 的 jsonb 连接 运算 符 〈|| ) 以 及 删 减 运算 符 (- 、#- ) ， 同 
时 还 引入 了 一 些 辅 助 操作 函数 。 注 意 ，json 类 型 并 不 支持 这 些 运算 
符 。 如 果 要 在 PostgreSQL 9.5 之 前 的 版 本 中 实现 相同 的 功能 ， 必 须 
通过 JavaScript 扩展 语言 来 实现 ， 可 参考 8.5 市 的 内 容 。 


连接 运算 符 可 用 于 对 一 个 jsonb 对 象 新 增 或 者 替换 其 内 部 属性 字 
段 。 在 示例 5-34 中 ， 我 们 为 Gomez 家 对 应 的 jsonb 对 象 新 增 了 一 
个 地 址 属性 ， 并 使 用 RETURNING 语法 返回 了 更 新 后 字段 的 值 。 关 
于 RETURNING 语法 ， 请 参考 7.2.10 节 的 内 容 。 返 回 的 新 值 中 会 含 
有 地 址 属性 字段 。 


示例 5-34 使 用 JSONB 的 | | 运算 符 来 增加 地 址 








UPDATE persons_b 
SET person = person || '{"address": "Somewhere in San Diego, CA"}'::js 
WHERE person @> '{"name":"Sonia"}' 


RETURNING person; 





由 于 JSONB 类 型 要 求 内 部 属性 字段 的 键 值 必须 唯一 ， 因 此 如 果 你 
试图 插入 一 个 重复 名 称 的 属性 字段 ， 原 来 的 同名 属性 字段 值 会 被 葵 
换 反 。 因 此 如 需 修改 旧地 址 ， 可 以 使 用 与 示例 5-34 中 完全 相同 的 
语句 ， 只 需 把 其 中 的 “Somewhere in San Diego, CA” 蔡 换 为 新 的 地 址 
Ba]。 


如 下 需 要 把 地 址 属性 删 控 ， 可 以 使 用 - 运算 待 ， 如 示例 5-35 所 
外。 


示例 5-35 ”使 用 JSONB 的 - 运算 符 来 移 除 某 个 属性 





UPDATE persons_b 
SET person = person - 'address' 


WHERE person @> '{"name":"Sonia"}'; 





请 注意 ， 简 单 地 使 用 - 运算 符 只 能 删 掉 JSONB 层次 化 树 结 构 上 第 

- 层 的 元 素 。 如 果 需 要 删除 内 部 某 一 层 的 特定 属性 怎么 办 呢 ? 此 时 
可 以 使 用 #- 运算 符 。 该 运算 符 使 用 一 个 表达 了 待 删除 属性 所 在 路 
径 的 在 示例 5-36 中 ， 我 们 删除 了 Azaleah 的 
girl 属性 。 


示例 5-36 使 用 JSONB 的 #- 运算 符 删 除 内 磐 的 某 个 元 素 





UPDATE persons_b 

SET person = person #- '{children,1,girl}'::text[] 
WHERE person @> '{"name":"Sonia"}' 

RETURNING person->'children'->1; 


{"name": "Azaleah", "phones": []} 





如 需 删 除 JSONB 内 部 数组 的 某 个 特定 元 系 ， 请 指明 其 下 标 。 由 于 
JavaScript 语言 中 数组 元 素 的 下 标 从 0 开始 计数 ， 所 以 如 条 要 删除 
第 二 个 子 世 点 的 某 个 元 素 ， 下 标 需 写成 1 而 不 是 2。 如 采 需 删除 整 
个 名 为 “Azalean” 的 子 节点 ， 可 以 写成 '{children,1}'::text[] 














如 需 插 入 一 个 gender 属性 或 者 是 修改 gender 属性 值 ， 可 以 使 用 
jsonb_set 函数 ， 如 示例 5-37 所 示 。 


示例 5-37 ”使 用 jsonb_set 函数 修改 内 部 租 套 的 属性 值 





UPDATE persons b 
SET person = jsonb set(person,'{children,1,gender}'::text[],'"F"'::jso 


WHERE person @> '{"name":"Sonia"}'; 





jsonb_set 函数 有 四 个 入 参 ， 其 定义 的 形式 

为 : jsonb_set(jsonb to update, text array_path, 
new_jsonb_value，allow_creation) 。 如 果 将 
allow_creation 置 为 false ， 当 所 需 修改 的 属性 值 不 存在 时 ， 该 
函数 会 返回 错误 。 


01. 5.7 “XML 数据 类 型 


XML 和 JSON 这 两 种 数据 类 型 都 属于 非 规范 化 数据 ， 在 关系 型 数 
据 库 中 存储 这 类 数据 其 实 是 有 争议 的 。 然 而 ， 所 有 的 高 级 关系 型 数 
据 库 (比如 IBM DB2、Oracle、SQL Server) 中 都 支持 XML 数据 
类 型 。 作 为 最 先进 的 开源 关系 型 数据 库 ，PostgreSQL 自然 也 会 支持 
XML 数据 类 型 ， 并 且 还 提供 了 大 量 XML 操作 函数 。 我 们 发 表 过 很 
多 关于 在 PostgreSQL 中 使 用 XML 数据 类 型 的 技术 文章 。 
PostgreSQL 原生 支持 创建 、 管 理 和 解析 XML 数据 的 函数 ， 详 细 列 
表 可 参见 PostgreSQL 官方 手册 中 “XML 函数 ”一 节 。 与 jsonb 数据 
类 型 不 一 样 ， 目 前 没有 哪 种 索引 类 型 支持 直接 对 XML 数据 类 型 进 
行 索 引 ， 因 此 只 能 使 用 函数 索引 对 其 一 部 分 数据 进行 索引 ， 这 一 点 
与 json 是 相同 的 。 


5.7.1 插入 XML 数据 


在 往 一 个 xml 数据 类 型 的 列 中 插入 数据 时 ，PostgreSQL 会 自动 判 
定 并 确保 只 有 格式 合法 的 XML 才 会 创建 成 功 。text 类 型 字段 中 也 
可 以 存 入 一 段 XML 文本 ,但 是 存 入 时 不 会 进行 格式 合法 性 判断 ， 
这 一 点 是 text 与 xml 类 型 的 区 别 。 不 过 请 注意 ， 即 使 XML 文本 
的 内 容 中 附带 了 DTD 或 者 XSD 的 格式 描述 ，PostgreSQL 也 不 会 按 
照 这 些 格 式 要 求 来 对 XML 的 格式 进行 验证 。 为 了 梳理 一 下 构成 有 
效 XML 的 要 素 ， 示 例 5-38 展示 了 通过 将 某 个 列 声明 为 xml 并 照 
常 将 数据 插入 到 该 列 中 ， 如 何 将 XML 数据 追加 到 表 中 。 


示例 5-38 ”插入 XML 字段 记录 











CREATE TABLE families (id serial PRIMARYKEY, profile xml); 


INSERT INTO families(profile) 
VALUES( 

"<family name="Gomez"> 
<member><relation>padrex</relation><name>Alex</name></member> 
<member><relation>madre</relation><name>Sonia</name></member> 
<member><relation>hijo</relation><name>Brandon</name></member> 
<member><relation>hija</relation><name>Azaleah</name></member> 
</family>'); 





XML 数据 的 格式 是 生变 万 化 的 ， 你 可 以 为 XML 字段 设置 一 个 
check 约束 以 确保 输入 的 XML 数据 都 符合 某 种 格式 〈 如 需 了 解 
check 约束 的 详细 信息 ， 请 参考 6.2.3 节 的 内 容 ) 。 示 例 5-39 中 创 
建 了 一 个 check 约束 ， 该 约束 要 求 输入 的 XML 数据 中 的 family 
节点 下 都 有 一 个 relation 节点 。'/family/member/relation， 
是 XPath 语法 ，XPath 是 一 种 能 够 在 XML 树 状 结构 中 定位 到 指定 
元 素 的 语法 。 


示例 5-39 ”确保 所 有 XML 字段 记录 中 都 有 至 少 一 个 member 
节点 和 一 个 relation 节点 





ALTER TABLE families ADD CONSTRAINT chk_has_relation 
CHECK (xpath exists('/family/member/relation', profile)); 





如 果 试 图 插入 这 样 一 条 记录 : 


INSERT INTO families (profile) VALUES ('<family name="HsuObe"></family 





我 们 会 看 到 这 样 的 报错 信息 : ERROR: new row for relation 
"families" violates check constraint 
"chk_has_relation"” 〔 错 误 : 试图 插入 “families” 表 中 的 新 记录 
违反 了 约束 “chk_has_relation” 的 要 求 )。 


如 果 需 要 基于 DTD 或 者 XSD 对 XML 数据 进行 格式 检查 ， 你 需要 
自行 编写 格式 检查 函数 ， 然 后 将 此 函数 放 到 check 约束 中 调用 。 
PostgreSQL 目前 还 没有 原生 文 持 基 于 DTD 或 者 XSD 的 格式 检查 。 


5.7.2 ”查询 XML 数据 


查询 XML 数据 时 ，xpath 函数 会 发 挥 重要 作用 。 该 函数 的 第 一 个 
参数 是 一 个 XPath 查询 表达 式 ， 第 二 个 参数 是 一 个 xm1l 对 象 。 查 询 
结果 是 XPath 查询 语句 所 要 查找 的 XML 元 素 的 列表 。 示 例 5-40 中 
查询 出 了 所 有 的 家 庭 成 员 ， 查 询 中 同时 使 用 了 xpath 和 unnest 也 
数 ， 其 中 unnest 函数 用 于 将 数组 转换 成 结果 集 。 这 样 我 们 就 把 一 

















段 XML 中 的 零碎 信息 提取 出 来 并 转换 成 了 文本 。 
示例 5-40 ”查询 XML 字段 


SELECT ordinality AS id, family, 
(xpath('/member/relation/text()', f))[1]::text As relation, 
(xpath('/member/name/text()', f))[1]::text As mem name © 
FROM ( 
SELECT 
(xpath('/family/@name', profile))[1]::text As family, @ 
f.ordinality, f.f 
FROM families, unnest(xpath('/family/member', profile)) NITH 0O 
) x;© 


id | family | relation | mem name 


2 | Gomez 

3 | Gomez j | Brandon 

4 | Gomez j | Azaleah 
(4 rows) 





@ 获取 每 个 member 元 素 的 relation 标签 和 name 标签 中 包含 的 
文本 元 素 。 此 处 的 语法 中 必须 加 数组 下 标 ， 因 为 xpath 语法 返回 
的 查询 结果 是 数组 类 型 的 ， 即 使 返回 的 数组 中 只 有 一 个 元 素 也 得 加 
下 标 才能 访问 。 


四 获取 family 根 节 点 的 name 属性 值 。 访 问 属性 值 的 语法 为 


@attribute _name 。 


四 将 SELECT 语句 的 查询 结果 拆 分 为 多 个 子 元 素 ， 这 些 子 元 素 包 括 
<member> 、<xrelation>、</relation>、<name>、</name> 
和 </member> 。xpath 的 斜 杠 语法 表示 要 获取 当前 指定 市 点 的 子 
节点 的 内 容 。 例 如 ，xpath('/family/member'，'profile') 将 
以 数组 形式 返回 profile 字段 中 family 节点 下 所 有 member 子 节 
点 的 内 容 。 xpath('/family/@name'，'profile') 返回 的 是 
family 下 节点 的 name 属性 的 值 。 默 认 情 况 下 ，xpath 返回 的 是 包 
售 前 后 标签 部 分 的 完整 节点 内 容 ， 加 了 text() 以 后 ， 返 回 的 就 是 
该 节点 中 包含 的 文本 的 内 容 。 








PostgreSQL 10 中 新 增 文 持 了 ANSI-SQL 中 的 XMLTABLE 语 

法 。XMLTABLE 可 以 基于 预定 义 好 的 转换 规则 ， 将 一 段 XML 文本 
ee 接 下 来 使 用 XMLTABLE 语法 把 示例 5-40 再 
实现 一 遍 。 


示例 5-41 使 用 XMLTABLE 语法 来 查询 XML 数据 


SELECT xt.* 
FROM families, 
XMLTABLE ('/family/member' PASSING profile © 
COLUMNS @ 
id FOR ORDINALITY , © 
family text PATH '../@name' , @ 
relation text NOT NULL , © 
member name text PATH ‘name’' NOT NULL 
) AS xt; 


relation | mem name 


| Alex 

| Sonia 

| Brandon 

| Azaleah 
(4 rows) 





@ XMLTABLE 定义 中 的 第 一 部 分 是 一 个 XML 路 径 ， 表 明 从 XML 
对 象 的 哪个 具体 位 置 抽取 数据 行 。PASSING 关键 字 后 跟 字 段 名 ， 表 
示 从 哪个 字段 中 抽取 行 数据 ， 该 字段 一 定 要 是 xml 类 型 。 此 处 我 们 
使 用 families 表 的 profile 字段 。 


@ COLUMNS 关键 字 表 示 下 面 即将 定义 从 XML 数据 中 抽取 出 来 的 字 
段 列表 。 


@ 此 前 介绍 过 ， 在 支持 返回 结果 集 的 函数 中 可 以 使 用 WITH 
ORDINALITY 语法 来 标记 所 返回 记录 的 行 号 ， 此 处 可 以 类 似 地 使 用 
FOR ORDINALITY 语法 来 标记 查询 结果 的 行 号 。 


@ 你 可 以 使 用 . ./ 表达 式 定 位 到 当前 行 位 置 的 上 一 层 。 此 处 我 们 
使 用 . ./Q@name 来 获取 family 节点 的 name 属性 ， 该 属性 所 在 的 
层级 比 family/member 节点 要 高 一 级 。@ 符号 表示 要 取 的 是 一 个 

















属性 值 (XML 中 属性 值 的 语法 形式 为 name='a value' ) 而 不 是 


一 个 元 系 。 


全 如 果 原 始 XML 中 待 取 数据 的 路 径 上 的 元 素 名 与 预定 义 的 转换 规 

则 中 指定 的 字段 名 相同 ， 则 无 须 在 规则 定义 中 为 目标 字段 设 定 

PATH 值 〈 即 该 字段 的 数据 来 源 路 径 ) 。 本 例 中 ， 由 于 原始 XML 中 

/family/member/ralation 这 个 路 径 上 的 relation 元 素 名 与 转 

换 规则 中 定义 的 relation 字段 同名 ， 所 以 无 须 在 这 里 写 PATH 来 
日 定 数据 来 源 路 径 。 





01. 5.8 ”全 文 检索 


我 相信 你 一 定 曾经 在 茶 些 网 站 上 体验 过 关键 词 搜索 功能 。 如 果 是 电 
商 类 网 站 ， 那 么 可 以 搜索 出 匹配 关键 词 的 商品 列表 ; 如 果 是 电影 类 
网 站 ， 那 么 可 以 搜索 出 符合 关键 词 过 滤 条 件 的 电影 ， 如 果 是 知识 问 
答 类 了 网站， 那么 可 以 搜索 出 匹配 关键 词 的 问题 和 答案 。 


要 想 实 现 通 过 关键 词 对 文本 内 容 进 行 搜索 ， 可 以 使 用 常见 的 1ike 
或 者 ilike (忽略 大 小 写 的 like》〉 这 样 的 匹配 方法 ， 也 可 以 使 用 强 
大 的 正则 表达 式 或 者 soundex 语音 匹配 算法 。 但 这 些 方法 都 存在 一 
个 问题 : 它们 无 法 实现 基于 自然 语言 的 匹配 。 人 例如， 如果 你 想 搜索 
LGBT 类 的 电影 ， 把 “LGBT"” 作 为 搜索 关键 词 ， 那 么 那些 电影 介绍 
中 带 有 “lesbian、gay、bisexual、transgendered” 的 电影 就 搜 不 出 来 ， 
因为 文本 不 匹配 。 


“ 英文 中 “ 女 同性 恋 、 男 同性 恋 、 双 性 人 、 变 性 人 ” 合 在 一 起 的 简称 。 























译 者 注 

















FTS (full text search， 全 文 检索 ) 是 一 个 带 有 一 定 “ 智 能 ”的 搜索 工 
具 包 。 虽 然 它 离 能 够 理解 人 类 的 真实 想法 还 差 得 远 ， 但 是 它 能 够 在 
搜索 过 程 中 找到 意义 相近 的 词 ， 而 不 仪 仅 是 拼写 相近 的 词 。FTS 是 
PostgreSQL 原生 上 自 帝 的 一 个 功能 模块 ， 不 需要 单独 安装 。 


FTS 的 核心 是 一 个 被 称 为 “FTS 配置 库 ” 的 东西 。 这 个 库 记 录 了 词 与 
词 之 间 的 语义 匹配 规则 ， 其 依据 是 一 本 或 者 多 本 词典 。 例 如 ， 如 果 
你 的 词典 将 love、romance、infatuation、lust 这 几 个 词 当 成 同 义 
词 ， 那 么 把 其 中 的 一 个 作为 关键 词 进 行 搜 索 时 ， 带 有 其 他 几 个 词 的 
文本 也 会 被 认为 是 符合 搜索 条 件 的 。 词 典 也 会 把 主干 相同 的 词 当成 
同义词 ， 例 如 love、loving、loved 就 是 主干 相同 的 词 。 词 典 还 会 将 
同一 个 动词 的 不 同时 态 下 的 分 词 作为 同义词 处 理 ， 比 如 eat、eats、 
ate、eaten 驶 会 被 认为 是 同义词 。 

词典 中 还 可 以 包含 停止 词 ， 它 是 指 一 段 话 中 意义 不 大 的 那 部 分 内 
全。 忆 辣 、 连接 词 、 介 词 、 代 词 都 是 停止 词 ， 比 如 a、the、on、 
that 等 。 


如 上 所 述 ，FTS 能 够 实现 同义词 搜索 以 及 对 无 意义 停止 词 的 过 渡 ， 























此 外 它 还 能 够 设置 搜索 结果 的 排名 规则 。FTS 可 以 根据 词 与 词 之 
间 的 邻近 程度 以 及 关键 词 出 现 的 频 度 来 为 搜索 结果 排名 。 例 如 ， 如 
果 你 对 描写 romance 和 campus 的 电影 感 兴趣 ， 可 以 同时 搜索 
romance 加 campus， 男 外 还 可 以 指定 这 两 个 关键 词 必须 作为 两 个 单 
独 的 词 存 在 ， 而 且 可 以 指定 对 于 同时 包含 这 两 个 关键 词 的 搜索 结果 
的 排名 应 更 靠 前 。FTS 还 文 持 为 同一 关键 词 出 现 的 位 置 不 同 而 给 予 
不 同 的 权重 评分 。 例 如 ， 如 果 电 影 的 标题 、 副 标题 或 者 剧情 介绍 中 
都 可 能 出 现 romance 字样 ， 你 可 以 让 标题 或 者 副标题 中 出 现 
romance 字样 的 电影 的 搜索 结果 排名 更 靠 前 。 


5.8.1 FTS 配 置 库 


大 多 数 PostgreSQL 发 行 版 中 都 自 带 了 10 个 以 上 的 FTS 配置 库 ， 这 
些 配置 库 都 安装 在 pg_catalog schema 中 。 








可 以 通过 SELECT cfgname FROM pg ts_config; 语句 或 者 是 
psq 的 \dF 命令 来 查 出 所 有 已 安装 的 配置 库 。 一 般 情况 下 查询 结果 
pF 下 : 


(16 rows) 





用 户 如 需 创 建 自 定义 的 配置 库 或 者 词典 ， 可 以 参考 PostgreSQL 官 





方 手册 中 “全 文 搜索 配置 库 ? 和 ”全文 搜索 词典 ”这 两 部 分 的 内 容 。 


PostgreSQL 并 不 要 求 用 户 使 用 系统 自 带 的 FTS 配置 库 ， 而 是 允许 
用 户 创 建 自 定 义 的 FTS 配置 库 。 但 在 真正 开始 创建 目 定 义 配置 库 
之 前 ， 建 议 你 查看 一 下 是 耕 已 经 有 别 的 用 户 创建 了 能 够 满足 你 要 求 
的 配置 库 ， 这 样 你 就 不 用 自己 重 弄 一 裔 了 。 如 果 你 要 做 检索 的 目标 
文本 属于 医学 领域 ， 你 可 能 会 发 现 已 经 有 人 创建 好 了 这 样 的 FTS 
词典 ， 其 中 记录 了 大 量 的 医学 术语 ; 如果 你 要 检索 西班牙 文 的 文 
本 ， 也 可 以 找到 为 你 所 要 的 西班牙 方言 量 身 定做 的 配置 库 。 


一 旦 确定 了 要 谎 加 的 目标 配置 库 ， 安 装 非 常 简单 ， 一 般 也 不 需要 进 
行 编译 。 我 们 以 著名 的 hunspell 配置 库 为 例 来 演示 安装 过 程 。 


请 先 从 hunspell_dicts 下 载 hunspell 配置 库 。 该 库 支 持 多 种 语言 ， 我 
们 选择 安装 其 中 的 hunspell_en_us。 


(1) 下 载 对 应 目录 中 的 所 有 文件 。 


(2) 将 下 载 的 en_us.affix 和 en_us.dict 这 两 个 文件 复制 到 PostgreSQL 
安装 目录 下 的 share/ tsearch_data 子 目 录 中 。 


(3) 将 hunspell_en_us--*.sql 和 hunspell_en_us.control 文件 复制 到 
PostgreSQL 安装 目录 下 的 share/extension 子 目录 中 。 


然后 执行 以 下 命令 : 


CREATE EXTENSION hunspell en us SCHEMA pg_catalog; 


然后 在 psql 中 执行 示例 5-42， 束 可 以 看 到 刚刚 安装 的 hunspell 配置 
库 和 词典 的 细 市 。 


示例 5-42 ”FTS 的 hunspell 配置 库 


























\dF+ english hunspell; 


Text search configuration "pg catalog.english hunspell" 
Parser: "pg catalog.default" 
Token | Dictionaries 


asciihword english hunspell,english_ stem 
asciiword english hunspell,english stem 
email simple 
file simple 
float simple 
host simple 


+ 
| 
| 
| 
| 
| 
| 
hword | english hunspell,english stem 
hword_asciipart | english hunspell,english stem 
hword_ numpart | simple 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 


hword_ part english hunspell,english stem 
int simple 
numhword simple 
numword simple 
sfloat simple 
uint simple 
url simple 
url_ path simple 
version simple 
word english hunspell,english stem 











做、 请 注意 ， 不 是 所 有 FTS 配置 库 的 安装 方法 都 完全 相 
同 ， 请 按照 各 目的 安装 手册 来 安装 。 


示例 5-43 中 的 命令 用 来 查看 PostgreSQL 自 带 的 English 配置 库 的 
详情 ， 输 出 结果 中 会 展示 使 用 了 哪些 词典 。 可 以 将 这 里 的 输出 内 容 
与 前 面 hunspell 配置 库 的 输出 内 容 做 个 对 比 。 


示例 5-43 FTS 的 English 配置 库 





\dF+ english; 


Text search configuration "pg catalog.english" 
Parser: "pg catalog.default" 


Token | Dictionaries 
ee a 
asciihword | english_ stem 
asciiword | english stem 
email | simple 
file | simple 
float | simple 
host | simple 


hword 
hword asciipart 


english_stem 
english_stem 


| 

| 
hword_ numpart | simple 
hword_ part | english stem 
int | simple 
numhword | simple 
numword | simple 
sfloat | simple 
uint | simple 
url | simple 
url_path | simple 
version | simple 
word | english stem 





可 以 看 到 ， 二 者 唯一 的 区 别 就 是 hunspell 配置 库 额 外 依赖 了 一 个 名 
为 english_hunspell 的 词典 


如 果 想 了 解 哪个 配置 库 是 系统 当前 默认 使 用 的 库 ， 可 以 这 样 查 询 : 


SHOW default text search config; 


如 果 和 希望 修改 默认 配置 ， 可 以 使 用 这 个 命令 


ALTER DATABASE postgresql book 
SET default text search config = 'pg catalog.english'; 





倒 换 后 该 参数 是 在 database 级 别 生 效 的 ， 但 它 也 可 以 在 服务 占 级 、 
用 户 级 或 者 会 话 级 生效 ， 这 一 点 和 其 他 配置 参数 没什么 不 同 。 





5.8.2 ”TSVector 原 始 文本 向 量 


原始 文本 必须 先 被 回 量 化 然后 才能 通过 FTS 对 其 进行 全 文 检 索 ， 

问 量 化 以 后 的 内 容 需 存储 在 一 个 单独 的 回 量 字段 中 ， 该 癌 量 字段 使 
用 的 数据 类 型 是 tsvector 。 要 从 原始 文本 中 生成 tsvector 向 量 
字段 ， 需 要 先 指定 使 用 哪个 FTS 配置 库 。 原 始 文本 经 过 向 量化 处 

















理 以 后 会 变 成 一 个 很 精简 的 单词 库 ， 这 个 库 中 的 每 个 词 都 被 称 

为 “词素 ”(lexeme， 即 不 能 再 拆 解 的 单词 或 词组 ， 如 果 拆 解 将 失去 
原来 的 含义 ) ， 同 时 这 个 库 已 经 剔除 了 前 面 介 绍 过 的 停止 

词 。tsvector 字段 中 记录 了 每 个 词素 在 原 6 文本 中 出 现 的 位 置 。 
一 个 词 出 现 的 次 数 越 多 ， 其 权重 值 也 就 越 大 。 这 样 每 个 词素 都 会 对 
应 至 少 一 个 位 置信 息 ， 如 果 出 现 多 次 则 对 应 多 个 位 置信 息 ， 看 起 来 
0 可 变 长 或 变 短 的 向 量 ， 这 也 是 tsvector 这 个 名 字 的 由 





























可 以 使 用 to_tsvector 函数 来 对 一 个 大 文本 对 象 进行 同 量化 。 默 
认 情 况 下 ， 该 函数 会 使 用 系统 默认 的 FTS 配置 库 ， 当 然 你 也 可 以 
显 式 指定 使 用 男 一 个 FTS 配置 库 。 


示例 5-44 演示 了 基于 不 同 的 FTS 配置 库 将 同一 段 文本 向 量化 以 后 
得 到 的 结果 有 何 差 异 。 


示例 5-44 基于 不 同 的 FTS 配置 库 对 文本 进行 向 量化 操作 








WHEN c.name ='default' THEN to tsvector(f.t) 
ELSE to tsvector(c.name::regconfig,f.t) 
END As vect 
FROM ( 
SELECT 'Just dancing in the rain. I like to dance.'::text) As f(t) 
VALUES ('default'),('english'),('english hunspell'),('simple') 
) As c(name); 


'danc':2,9 'like':7 'rain': 
'danc':2,9 'like':7 "rain' :5 
english hunspell 'dance':2,9 'dancing':2 'like':7 'rain':5 
simple 'dance':9 'dancing':2 'i':6 'in':3 'just':1 'like': 
'rain':5 'the':4 'to':8 
(4 rows) 





从 示例 5-44 中 可 以 看 出 基于 四 个 个 同 的 FTS 配置 库 得 到 的 文本 问 
量化 结果 有 何不 同 。 请 注意 其 中 的 English 和 un pe 配置 库 吻 除 
了 所 有 像 just 和 to 这 样 的 停止 词 ， 此 外 还 按照 词典 中 记录 的 信息 


对 部 分 单词 进行 了 规范 化 处 理 ， 比 如 dancing 变 成 了 danc 或 者 
dance。Simple 配置 库 不 识别 词 干 和 停止 词 ， 因 此 其 向 量化 结果 中 
就 会 出 现 同一 个 词 的 多 种 时 态 和 那些 停止 词 。 


可 以 看 到 ，to_vector 函数 的 输出 结果 中 还 包含 每 个 词素 在 原始 文 
本 中 出 现 的 位 置 。 比 如 ，'danc' :2,9 就 表示 dancing 和 dance 这 
两 个 词 分 别 出 现 在 原始 文本 中 的 第 二 个 词 和 第 九 个 词 的 位 置 。 


要 想 在 你 的 database 中 文 持 FTS 能 力 ， 需 要 在 存储 原始 文本 的 表 上 
增加 一 个 tsvector 类 型 的 癌 量 字段 ， 然 后 通过 定时 任务 定期 更 新 
该 问 量 字段 或 者 在 表 上 创建 个 触发 器 ， 一 旦 原始 文本 字段 发 生 了 修 
改 ， 则 同时 更 新 问 量 字段 。 


我 们 通过 一 些 虚 构 的 电影 数据 来 进行 演示 。 用 psql 工具 可 以 执行 其 
中 的 得 m.sql 脚本 ， 语 法 如 下 : 























\encoding utf8; 
\i film.sql 





然后 我 们 为 film 表 添 加 一 个 tsvector 向 量 字段 ， 并 生成 其 内 
容 ， 如 示例 5-45 所 示 。 


示例 5-45 “增加 tsvector 向 量 字 段 并 设置 词素 权重 


ALTER TABLE film ADD COLUMN fts tsvector; 

UPDATE film 

SET fts = 
setweight(to tsvector(COALESCE(title,'')),'A') || 
setweight(to tsvector(COALESCE(description,'')),'B'); 


CREATE INDEX ix film fts gin ON film USING gin (fts); 





示例 5-45 中 ， 我 们 对 title 和 description 字段 进行 了 向 量化 并 
把 结果 存 入 了 新 增 的 向 量 字段 。 为 了 使 查询 更 快 ， 我 们 还 在 向 量 字 
段 上 创建 了 一 个 GIN 类 型 的 索引 。GIN 是 无 损 索引 ， 你 也 可 以 对 
其 创建 一 个 GiST 类 型 的 有 损 索 引 。 相 比 GIN 索引 ，GiST 索引 的 
特点 是 原始 数据 信息 可 能 会 丢失 并 且 访 问 速 度 会 慢 一 些 ， 但 它 的 构 








造 速度 很 快 而 且 占 用 磁盘 空间 也 更 小 。 相 关内 容 在 6.3 市 中 有 更 详 





可 以 看 到 ， 我 们 在 为 fts 字段 生成 数据 的 过 程 中 还 使 用 了 男 外 两 个 
前 面 没 介绍 过 的 语法 : setweight 函数 和 连接 运算 符 | | 。 


为 了 区 分 不 同 词素 的 重要 程度 ， 我 们 引入 了 权重 (weight)〉 的 概 
念 ， 每 个 词素 都 有 自己 的 权重 。 权 重 值 只 能 是 A、B、C 和 DD 四 类 
中 的 一 种 ，A 类 表示 重要 程度 最 高 ， 在 搜索 结果 中 也 需要 排名 最 靠 
前 。 在 示例 5-45 中 ， 我 们 为 从 原始 文本 的 title 字段 中 抽取 出 来 
的 词素 赋予 了 A 类 权重 ， 然 后 为 description 字段 中 的 词素 赋予 
了 B 类 权重 。 如 果 我 们 搜索 的 关键 词 合 中 了 title 中 的 某 个 词 
素 ， 那 么 我 们 认为 这 个 搜索 结果 比 从 description 字段 抽取 出 来 
的 词素 命中 的 结果 相关 性 更 高 ， 更 符合 用 户 的 需要 。 


多 个 tsvector 问 量 可 以 通过 连接 运算 符 | | 合并 为 一 个 新 的 
tsvector 。 我 们 在 前 面 的 例子 中 使 用 了 该 运算 符 将 title 和 
description 中 生成 的 加 量 合并 为 一 个 ， 这 样 真正 执行 全 文 检索 
时 ， 只 需要 搜索 一 个 向 量 字段 即 可 。 


如 果 原 始 文 本 字段 的 内 容 发 生 了 改变 ， 那 么 必须 对 其 重新 进行 向 量 
化 。 为 了 避免 每 次 都 要 手动 执行 to_tsvector 来 重新 向 量化 ， 可 
以 针对 更 新 操作 建立 一 个 触发 器 。 这 个 触发 器 可 以 基于 下 面 这 个 非 
常 好 用 的 触发 器 函数 来 构造 ， 如 示例 5-46 所 示 。 


示例 5-46 ”能够 日 动 更 新 问 量 字 上段 的 触发 姨 









































CREATE TRIGGER trig tsv film iu 
BEFORE INSERT OR UPDATE OF title, description ON film FOR EACH ROW 


EXECUTE PROCEDURE tsvector update trigger(fts,'pg catalog.english', 


title,description); 





一 旦 在 title 或 description 字段 上 执行 了 insert 或 者 update 
操作 ， 则 该 触发 絮 会 被 触及 ， 然 后 会 自动 完成 重新 问 量化 的 工作 。 
这 个 方法 有 个 缺点 ， 束 是 里 面 调用 的 tsvector_update_trigger 
函数 不 文 持 设置 权重 。 








5.8.3 ”TSQueries 检 索 条 件 癌 量 


对 于 FTS 或 者 任何 别 的 文本 检索 方法 来 说， 都 必须 具备 两 个 基本 
元 素 : 一 个 是 被 检索 的 原始 文本 ， 一 个 是 检索 条 件 (或 者 说 关键 
词 ) 。 对 FTS 来 说 ， 原 始 文本 和 检索 条 件 都 必须 先 被 癌 量 化 然后 
才能 使 用 。 前 面 已 经 介绍 过 了 如 何 针对 原始 文本 创建 tsvector 问 
量 字 段 ， 接 下 来 将 介绍 如 何 对 检索 条 件 进行 向 量化 处 理 。 


在 FTS 检索 机 制 中 ， 用 tsquery 类 型 来 表示 向 量化 以 后 的 检索 条 
件 。PostgreSQL 提供 了 耕 干 函数 来 实现 检索 条 件 的 同 量化 处 理 ， 包 
括 to_tsquery 、plainto tsquery 和 phraseto tsquery。 其 
中 phraseto_tsquery 是 PostgreSQL 9.6 新 引入 的 ， 相 比 其 他 两 
个 ， 该 函数 会 将 检索 条 件 中 各 关键 词 的 顺序 也 考虑 在 内 。 


检索 条 件 向 量 一 般 是 运行 时 临时 生成 的 ， 不 会 放 到 表 中 存储 下 来 。 
然而 ， 如 果 你 的 系统 支持 用 户 把 自 定义 的 检索 条 件 存储 下 来 供 下 次 
那么 你 可 以 把 解析 后 的 回 量 数据 用 tsquery 类 型 的 字段 存 
下 来; 


示例 5-47 演示 了 to_tsquery 函数 的 输出 结果 ， 分 别 基于 两 个 配 
置 库 : 默认 的 English 库 和 我 们 后 加 的 Hunspell 库 。 


示例 5-47 用 to_tsquery 函数 来 构造 tsquery 向 量 














SELECT to tsquery('business & analytics'); 
to tsquery 


"busi' & 'analyt'" 


SELECT to tsquery('english hunspell','business & analytics'); 


to tsquery 


('business' 'busy') & 'analyt' 





这 两 个 例子 都 是 用 business 和 analytics 两 个 词 来 进行 全 文 检索 ， 其 
中 的 与 运算 符 (& ) 表示 两 个 关键 词 必须 在 目标 文本 中 同时 出 现 才 





算 检 索 命中 。 或 运算 符 〈| ) 表示 目标 文本 中 必须 出 现 两 个 词 中 的 
至 少 一 个 就 算 检索 命中 。 如 果 使 用 的 配置 库 查 到 其 中 的 某 个 关键 词 
拥有 多 个 词 干 ， 那 么 最 络 的 向 量化 结果 中 会 用 | 运算 符 把 这 些 词 二 
连接 到 一 起 呈现 。 





仆 在 对 检索 条 件 进行 向 量化 处 理 时 ， 使 用 的 配置 库 应 该 与 
对 原始 文本 向量 化 时 使 用 的 配置 库 相 同 。 


plainto_tsquery 是 to_tsquery 的 变种 ， 它 会 自动 在 检索 条 件 
的 关键 词 之 间 加 上 & 运算 符 ， 可 以 为 你 节省 一 点 时 间 。 语 法 如 示例 
5-48 所 示 。 











示例 5-48 用 plainto tsquery 函数 来 构造 tsquery 向 量 


SELECT plainto tsquery('business analytics'); 


plainto tsquery 


"busi' & 'analyt'" 











to_tsquery 和 plainto_tsquery 仅 考 虑 关键 词 本 身 ， 不 考虑 其 
先后 位 置 。 因 此 对 这 两 个 函数 来 说 , “business analytics” 和 “analytics 
business” 得 到 的 tsquery 结果 是 一 样 的 。 由 于 无 法 识别 词 与 词 之 间 
的 先后 顺序 ， 和 带 来 的 问题 就 是 用 户 只 能 搜索 单个 关键 词 。 
PostgreSQL 9.6 中 为 了 解决 这 个 问题 而 引入 了 phraseto tsquery 
函数 。 在 示例 5-49 中 可 以 看 到 ，phraseto_tsquery 函数 的 向 量 
化 结果 中 在 词素 与 词素 之 间 增 加 了 距离 运算 符 ， 这 意味 着 在 检索 日 
标 文 本 中 business 和 analytics 两 个 词 必须 以 一 定 顺 序 出 现时 才 算 命 
中 。 这 样 束 从 功能 上 实现 了 从 单词 搜索 到 词组 搜索 的 进化 。 


示例 5-49 用 phraseto tsquery 函数 来 构造 tsquery 向 量 
































SELECT phraseto tsquery('business analytics'); 


phraseto tsquery 


'busi' <-> 'analyt' 


SELECT phraseto tsquery('english hunspell','business analytics'); 


phraseto tsquery 





你 还 可 以 直接 使 用 类 型 强 转 语法 将 文本 串 转 为 tsquery 数据 ， 这 
样 就 无 须 使 用 前 面 介绍 的 几 个 函数 ， 语 法 类 似 'business & 
analytics'::tsquery 。 这 样 做 虽然 简单 ， 但 也 意味 着 无 法 利用 
前 述 函 数 提供 的 功能 ， 检 索 关 键 词 不 会 被 抽取 为 词素 ， 只 会 被 简单 
地 原文 复制 。 


多 个 tsquery 同 量 数据 可 以 使 用 或 运算 符 〈(|| ) 或 者 与 运算 符 
(&& ) 连接 在 一 起 。tsquery1 || tsquery2 表达 式 的 意思 是 检 

索 目 标 文 本 要 么 满足 tsquery1 条 件 ， 要 么 符合 tsquery2 条 

件 。tsquery1 && tsquery2 表达 式 的 意思 是 检索 目标 文本 必须 

同时 满足 tsqueryl 和 tsquery2 条 件 。 


示例 5-50 分 别 演示 了 这 两 种 情况 。 


示例 5-50 ”多 个 tsquery 向 量 的 关联 

















SELECT plainto tsquery('business analyst') || phraseto tsquery('data s 


<-> 'scientist'"' 


'busi' & 'analyst' & ('data' <-> 'scientist') 





tsquery 和 tsvector 这 两 种 数据 类 型 还 文 持 其 他 一 些 运算 符 ， 比 
如 判定 一 个 向 量 值 是 否 是 另 一 个 向 量 值 的 子 集 等 。 详 情 请 参考 官方 
手册 中 “全 文 检索 函数 和 运算 符 ” 一 节 的 内 容 。 




















5.8.4 ”使 用 全 文 检索 

前 面 已 经 为 原始 文本 创建 好 了 tsvector 向 量 数据 ， 也 为 检索 条 件 
创建 好 了 tsquery 回 量 数据 ， 现 在 可 以 真正 地 执行 全 文 检 索 了 。 
FTS 检索 使 用 的 是 @@ 运算 符 ， 如 示例 5-51 所 示 。 


示例 5-51 进行 FTS 检索 





SELECT left(title,56) As title, left(description,560) as description 

FROM film 

WHERE fts QQ to tsquery('hunter & (scientist | chef)') AND title > '' 
description 


ALASKA PHANTOM 

CAUSE DATE 

CINCINATTI WHISPERER 
COMMANDMENTS EXPRESS 
DAUGHTER MADIGAN 
GOLDFINGER SENSIBILITY 
HATE HANDICAP 

INSIDER ARIZONA 

WORDS HUNTER 

(9 rows) 


Fanciful Saga of a Hunter And a Pastry Chef 
Taut Tale of a Explorer And a Pastry Chef w 
Brilliant Saga of a Pastry Chef And a Hunte 


Fanciful Saga of a Student And a Mad Scient 
Beautiful Tale of a Hunter And a Mad Scient 
Insightful Drama of a Mad Scientist And a H 
Intrepid Reflection of a Mad Scientist And 
Astounding Saga of a Mad Scientist And a Hu 
Action-Packed Reflection of a Composer And 


PPPDPDPDPDPIDDID 





示例 5-51 中 查 出 了 所 有 title 和 description 字段 中 含有 hunter 
这 个 词 ， 并 且 还 含有 scientist 或 者 chef 这 两 个 单词 中 的 一 个 或 者 两 
个 的 所 有 电影 。 


如 果 你 当前 使 用 的 是 PostgreSQL 9.6， 那 么 还 可 以 指定 检索 条 件 内 
部 的 关键 词 之 间 的 接近 度 和 出 现 的 先后 顺序 ， 如 示例 5-52 所 示 。 


示例 5-52 指定 了 关键 词 先 后 顺序 和 接近 度 的 FTS 检索 








SELECT left(title,56) As title, left(description,560) as description 
FROM film 
WHERE fts QQ to tsquery('hunter <4> (scientist | chef)') AND title > ' 


title | description 

DE Ra 有 丰 三 攻 生 二 三 司 区 区 二 = 
ALASKA PHANTOM | A Fanciful Saga of a Hunter And a Pastry Chef who 

DAUGHTER MADIGAN | A Beautiful Tale of a Hunter And a Mad Scientist w 


(2 rows) 


示例 5-52 中 要 求 hunter 在 scientist 或 者 chef 之 前 ， 而 且 它 们 之 间 
必须 相差 4 个 词 。 


5.8.5 “对 检索 结果 进行 排序 


FTS 文 持 对 检索 结果 进行 排序 ， 具 体 是 通过 ts_rank 和 
ts_rank_cd 这 两 个 函数 来 实现 的 。ts_rank 函数 只 考虑 检索 关键 
词 在 目标 文本 中 出 现 的 频率 和 权重 ， 而 ts_rank_cd (cd 代表 
coverage density， 即 覆盖 密度 ) 还 考虑 了 关键 词 在 目标 文本 中 出 现 
的 位 置 。 检 索 条 件 中 的 词素 在 被 检索 文本 中 出 现 的 位 置 越 靠近 ， 则 
该 条 检索 结果 的 相关 度 越 高 ， 最 终 排名 越 靠 前 。 只 有 当 原 始 文本 的 
tsvector 向 量 数据 中 带 有 位 置 标 记 时 ， 使 用 ts_rank_cd 函数 才 
有 意义 ， 因 为 没有 位 置 标 记 的 情况 下 根本 无 法 计算 检索 关键 词 之 间 
的 距离 ， 此 时 该 函数 的 返回 值 是 0。 另外 ， 我 们 很 容易 就 能 想到 检 
索 关 键 词 出 现 的 频率 也 需要 根据 位 置 标记 才能 计算 出 来 。 因 此 ， 如 
果 被 检索 的 原始 文本 的 tsvector 向 量 数 据 中 没有 提供 位 置 标记 的 
话 ，ts_rank 函数 束 只 能 依赖 权重 来 排名 了 。 默 认 情 况 

下 ，ts_rank 和 ts_rank_cd 函数 在 计算 过 程 中 会 将 权重 值 A、 
B、C、D 映射 为 1.0、0.4、0.2 和 0.1， 之 后 再 进行 计算 。 示 例 5-53 
使 用 了 默认 的 排序 参数 。 


示例 5-53 对 检索 结果 进行 排序 














SELECT title, left(description,560) As description, 
ts rank(fts,ts)::numeric(160,3) AS r 
FROM film, to tsquery('english','love & (wait | indian | mad)') AS ts 
WHERE fts QQ ts AND title > "' 
ORDER BY r DESC; 
| description 


INDIAN LOVE | A Insightful Saga of a Mad Scientist And a Mad Sci 
LAWRENCE LOVE | A Fanciful Yarn of a Database Administrator And a 
(2 rows) 





假设 我 们 和 希望 只 有 当 检 索 条 件 字段 出 现在 title 字段 中 时 才 算 命 
中 ， 那 么 我 们 可 以 将 title 的 权重 值 设置 为 1， 其 他 字段 的 权重 值 
都 设 为 0。 接 下 来 用 示例 5-54 再 实现 一 遍 示 例 5-53 相同 的 检索 迎 
辑 ， 唯 一 的 差别 是 这 次 传 入 了 一 组 权重 值 。 


示例 5-54 ”使 用 用 户 自 定义 的 权重 值 来 对 检索 结果 进行 排序 





SELECT 


left(title,46) As title, 

ts _ rank('{06,0,0,1}'::numeric[],fts,ts)::numeric(160,3) AS r, 

ts rank_cd('{06,60,060,1}'::numeric[],fts,ts)::numeric(160,3) As rcd 
FROM film, to tsquery('english', 'love & (wait | indian | mad )') AS 七 
WHERE fts QQ ts AND title > "' 
ORDER BY r DESC; 


INDIAN LOVE 
LAWRENCE LOVE 
(2 rows) 





请 注意 : 上 面 输出 的 第 二 行 结果 中 的 rank 值 都 是 0， 这 是 因为 该 记 
录 的 title 字段 内 容 并 不 完全 满足 tsquery 条 件 的 要 求 。 





和 如 果 你 对 检索 性 能 非常 在 意 ， 那 么 我 们 建议 在 查询 语句 
中 显 式 地 指明 FTS 配置 库 ， 而 不 要 依赖 默认 值 。 根 据 Oleg 
Bartunov 的 博文 “Some FTS Tricks” 中 的 介绍 ， 使 用 

to tsquery('english','social & (science | 
scientist)') 这 种 写法 会 比 使 用 to_tsquery('social & 
(science| scientist)') 这 种 写法 快 一 倍 。 


5.8.6 ”全 文 检索 问 量 信息 的 裁减 


默认 情况 下 ， 对 原始 文本 进行 同 量化 处 理 时 会 自动 加 上 位 置 标记 
( 即 词素 在 原始 文本 中 出 现 的 位 置 ) 以 及 可 选 的 权重 值 (A、B、 
C、D 四 档 ) 信息 。 但 如 果 你 的 检索 目标 是 只 要 匹配 了 检索 条 件 中 
的 关键 词 就 可 以 ， 而 完全 不 关心 这 些 结果 中 关键 词 出 现 的 位 置 、 出 
现 的 频率 以 及 重要 性 ， 那 么 你 完全 可 以 用 strip 函数 对 tsvector 

















向 量 数据 进行 裁减 ， 这 样 可 以 节省 磁盘 空间 ， 也 可 以 提升 查询 束 
度 。 示例 5-55 比较 了 裁减 前 和 裁减 后 向 量 数据 的 差异 。 


示例 5-55 ”裁减 前 和 裁减 后 回 量 数据 的 比较 








SELECT fts 
FROM film 
WHERE film id = 1; 


"academi' :1A "batt1' :15B "canadian':26B 'dinosaur':2A “drama':5B "epic 
"feminist':8B "mad':11B "must' :14B 'rocki':21B 'scientist':12B 'teache 


SELECT strip(fts) 
FROM film 
WHERE film id = 1; 


'academi' 'battl' 'canadian' 'dinosaur' 'drama' 'epic' 'feminist' 'mad 
'must' 'rocki' 'scientist' ‘'teacher' 





请 务必 牢记 : 虽然 裁减 后 的 tsvector 向 量 数 据 查 询 起 来 更 快 ， 占 
用 磁盘 空间 更 少 ， 但 很 多 运算 符 和 函数 都 不 支持 与 这 种 裁减 后 的 向 
量 数据 配合 使 用 。 例 如 ， 由 于 裁减 后 的 向量 数据 中 不 含 位 置 标记 信 
息 ， 因 此 就 不 可 以 对 其 使 用 距离 运算 符 。 


5.8.7 “全文 检索 机 制 对 JSON 和 JSONB 数 据 类 型 的 支持 


PostgreSQL 10 中 为 ts_headline 和 to _tsvector 函数 新 增 了 可 

以 处 理 json 和 jsonb 数据 的 版 本 。 这 两 个 函数 的 json/jsonb 入 
参 版 本 的 使 用 方式 与 其 text 入 参 版 本 的 用 法 完全 相同 ， 唯 一 值得 
注意 的 地 方 是 它们 仅 处 理 json/jsonb 数据 中 的 value 部 分 ， 而 不 
会 关注 key 部 分 以 及 json 本 身 的 那些 标记 符 。 示 例 5-56 用 这 两 个 
函数 对 示例 5-28 中 创建 的 表 中 的 person 字段 进行 了 处 理 。 


示例 5-56 对 json/jsonb 数据 进行 tsvector 向 量化 处 理 





SELECT to tsvector(person) 
FROM persons WHERE id=1; 


to tsvector 


"-5083 ' :19 '-6719':13 ' -722 ' :12 '-852':18 '619':11,17 'alex':3 'azale 
"brandon ' :21 'cell':15 'm':23 'ofelia':7 'rafael':5 'sonia':1 "work ': 
(1 row) 





上 例 演 示 的 是 处 理 json 类 型 ， 如 果 要 演示 处 理 jsonb 类 型 ， 只 需 
把 脚本 中 的 person 换 成 person_b 即 可 。json 、jsonb 入 参 版 本 的 





ts_headline 和 to _tsvector 函数 各 自 还 有 一 个 变 体 ， 其 第 一 个 
参数 可 用 于 指定 用 哪个 FTS 配置 库 ， 这 个 特点 与 text 入 参 版 本 的 
ts_headline 和 to _tsvector 函数 完全 相同 。 为 了 更 好 地 利用 这 
些 函 数 的 能 力 ， 我 们 推荐 的 做 法 是 在 被 检索 的 json/jsonb 数据 所 
在 的 表 上 先 增加 tsvector 回 量 字段 ， 然 后 创建 触发 器 在 修改 时 自 
动 生成 或 者 在 需要 时 手工 生成 回 量 数据 。 


如 前 所 述 ，ts_headline 函数 也 有 了 支持 json/jsonb 入 参 的 版 

本 ， 该 函数 的 功能 是 将 json/jsonb 数据 中 所 有 命中 的 文本 都 标记 

人 格式 。 示 例 5-57 对 JSON 文档 数据 中 所 有 的 Rafael 文本 
做 了 标记 。 


示例 5-57 对 检索 命中 的 文本 打上 标记 








SELECT ts _ headline(person->'spouse'->'parents', 'rafael'::tsquery) 
FROM persons b WHERE id=1; 


{"father": "<b>Rafael</b>", "mother": "Ofelia"} 
(1 row) 





请 注意 ， 上 面 输出 的 命中 结果 前 后 已 打上 了 HIML 的 <b> 标签 。 


01. 5.9 目 定义 数据 闫 型 和 复合 数据 类 型 


本 节 将 介绍 如 何 定 义 和 使 用 目 定义 数据 类 型 。composite (也 称 为 
record 、row ) 向 用 于 构建 需要 转 为 目 定 义 数 据 类 型 的 对 象 或 者 
征 作为 需要 返回 多 个 字段 的 函数 的 返回 值 类 型 定义 。 


5.9.1 所 有 表 都 有 一 个 对 应 的 自 定义 数据 类 型 


PostgreSQL 在 建 表 时 会 自动 创建 一 个 与 表 结 构 完全 相同 的 自 定义 数 
据 类 型 ， 而 且 这 种 类 型 与 其 他 的 原生 数据 类 型 在 使 用 上 有 坚 无 区 别 。 
可 以 在 建 表 时 指定 某 字 段 为 表 类 型 或 者 表 数 组 类 型 ， 也 就 是 说 可 以 
把 一 张 表 的 字段 定义 为 男 一 张 表 。 这 种 将 表层 层 租 套 的 用 法 

与 “turducken”( 特 大 哺 ) 3 很 像 。 在 示例 5-58 中 ， 我 们 将 用 “特大 
哨 ” 的 例子 来 演示 。 














A 


3 turducken 是 turkey-duck-chicken 的 简 























j 是 一 种 美食 新 吃 法 : 将 无 骨 鸡 填 到 无 骨 岗 的 
肚子 里 ， 然 后 再 将 填 了 无 骨 鸡 的 无 骨 鸭 填 到 无 骨 火 鸡 的 肚子 里 。 这 种 食物 很 好 地 体现 了 
多 层 抠 套 的 关系 。 一 一 译 者 注 
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示例 5-58 ”为 “特大 哺 ” 建 葵 套 表 


CREATE TABLE chickens (id integer PRIMARY KEY); 
CREATE TABLE ducks (id integer PRIMARY KEY, chickens chickens[]); 
CREATE TABLE turkeys (id integer PRIMARY KEY, ducks ducks[]); 


INSERT INTO ducks VALUES (1, ARRAY[ROW(1)::chickens, ROW(1)::chickens] 
INSERT INTO turkeys VALUES (1, array(SELECT d FROM ducks d)); 





上 面 我 们 直接 在 ducks 表 的 一 条 记录 的 chickens 字段 中 插入 了 两 
条 chickens 记录 ， 这 种 情况 下 这 两 条 记录 的 构造 不 受 chickens 
表 定 义 的 约束 ， 因 此 即使 它们 的 主键 重复 也 没关系 。 我 们 生成 了 两 
条 chickens 记录 ， 填 入 ducks 表 中 ， 然 后 将 这 条 ducks 记录 填 
入 到 turkeys 表 中 ， 这 个 过 程 相当 于 把 两 只 chicken 塞 入 一 只 
duck， 然 后 再 把 这 只 duck 塞 入 一 只 turkey， 跟 制作 “特大 哨 ” 的 过 程 
是 完全 一 样 的 。 





最 后 看 一 下 得 到 的 turkeys 记录 是 什么 样子 的 : 


SELECT * FROM turkeys; 


id | ducks 


一 一 = 十 一 一 一 一 一 一 一 一 一 一 一 一 一 一 


I(T (DD) 





舱 套 表 中 内 骸 的 表 记 录 是 可 以 进行 修改 的 。 例 如 ， 我 们 要 对 第 一 个 
turkey 内 岁 的 第 二 个 chicken 进行 修改 ， 那 么 可 以 执行 如 下 操作 : 


UPDATE turkeys SET ducks[1].chickens[2] = ROW(3)::chickens 
WHERE id = 1 RETURNING *; 


output 


id | ducks 
一 一 = 十 站 


LAE tL 3) 





我 们 使 用 RETURNING 子 句 来 返回 本 次 更 新 操作 涉及 的 所 有 记录 ， 
我 们 将 在 7.2.10 节 中 介绍 RETURNING 子 句 的 用 法 。 


一 个 复合 类 型 的 记录 行 或 者 字段 不 管 其 内 部 结构 有 多 么 复杂 ， 都 可 
以 被 转换 为 一 个 json 或 者 jsonb 类 型 的 字段 ， 语 法 如 下 : 





SELECT id, to jsonb(ducks) AS ducks jsonb 
FROM turkeys; 


id | ducks jsonb 
一 一 一 十 站 


1 | [{"id": 1, "chickens": [{"id": 1}, {"id": 3}]}] 
(1 row) 





PostgreSQL 内 部 维护 着 数据 库 对 象 之 间 的 依赖 和 关系。 前 述 ducks 


表 的 chickens 字段 依赖 于 chickens 表 ，turkeys 表 的 ducks 记 
录 依 赖 于 ducks 表 。 要 想 删 除 chickens 表 有 两 种 方法 ， 要 么 在 
drop 语句 中 带 上 CASCADE 关键 字 ， 要 么 先 删 除 ducks 表 中 的 
chickens 字段 。 如 果 使 用 前 一 种 方法 ， 那 么 ducks 表 的 
chickens 字段 会 被 自动 删除 ， 而 且 此 过 程 中 无 告警 信息 。 相 应 
地 ，turkeys 表 的 ducks 字段 的 定义 也 将 自动 跟着 改变 。 


5.9.2 ”构建 自 定 义 数 据 类 型 
尽管 仅仅 通过 创建 表 束 可 以 轻松 创建 复合 数据 类 型 ， 但 有 时 候 我 们 


仍 需要 从 头 开 始 构建 自己 的 数据 类 型 。 例 如 ， 使 用 以 下 语句 可 以 构 
府 一 个 复数 数据 类 型 : 


CREATE TYPE complex number AS (r double precision, i double precision) 


可 以 将 此 类 型 作为 字段 类 型 定义 使 用 : 


CREATE TABLE circuits (circuit id serial PRIMARY KEY, ac _ volt complex_ 


可 以 使 用 如 下 语法 对 这 个 表 进 行 查 询 : 


SELECT circuit id, (ac volt).* FROM circuits; 


这 种 语法 也 可 以 : 








SELECT circuit id, (ac volt).r, (ac volt).i FROM circuits; 








做、 你 可 能 会 问 : 上 面 语句 中 ac_volt 外 面 为 什么 要 加 括 
号 ? 如 果 不 加 的 话 ，PostgreSQL 会 报错 说 FROM 子 句 中 找 不 到 
ac_volt 这 张 表 。 根 据 这 一 点 就 很 好 理解 了 ， 加 括号 是 为 了 不 





让 PostgreSQL 将 其 理解 为 表 名 。 
5.9.3 ”复合 类 型 中 的 空 值 处 理 


在 ANSI SQL 标准 中 ， 两 个 NULL 值 之 间 不 允许 进行 “ 值 相 等 ”〈 即 
NULL=NULL ) 或 者 “ 值 不 等 ”( 即 NULL != NULL ) 判定 ， 这 一 点 经 
常会 给 用 户 带 来 理解 上 的 困难 。 当 处 理 NULL 值 时 ， 需 要 使 用 IS 
NULL、IS NOT NULL 或 者 NOT (somevalue IS NULL ) 这 种 表 
达 方 式 。 对 于 基础 数据 类 型 来 说 ，something IS NULL 就 是 
something IS NOT NULL 的 反 义 表达 式 ， 但 对 于 复合 数据 类 型 来 
说 却 并 不 是 这 样 。 


PostgreSQL 在 处 理 NULL 值 时 严格 遵循 ANSI SQL 标准 ， 其 中 规 
定 : 复合 数据 类 型 值 的 IS NULL 判定 要 想 成 立 ， 其 前 提 是 该 复合 
数据 类 型 值 的 每 一 个 元 素 都 是 NULL， 这 很 合理 。 但 接 下 来 就 有 
点 “不 太 人 合理? 了， 复合 数据 类 型 值 的 IS NOT NULL 判定 要 想 成 

立 ， 前 提 是 该 复合 数据 类 型 值 的 每 一 个 元 素 都 是 NULL， 而 不 是 说 
只 需 其 中 任何 一 个 元 素 不 为 NULL 即 可 。 这 里 特别 容易 出 错 ， 因 此 
请 牢记 此 规则 。 


5.9.4 ”为 自 定 义 数据 类 型 构建 运算 符 和 函数 


在 构建 自 定 义 数 据 类 型 后 ， 你 自然 就 需要 为 其 创建 相应 的 水 数 和 运 
算 符 。 接 下 来 将 演示 如 何 为 complex_number 类 型 创建 一 个 + 运 
算 符 ， 而 创建 处 理 函 数 的 方法 将 在 第 8 章 中 介绍 。 前 面 已 经 介绍 
过 ， 每 个 运算 符 都 有 一 个 底层 实现 图 数 ， 该 图 数 需要 一 个 或 者 两 个 
参数 ， 运 算 符 束 是 这 个 函数 的 符号 化 别名 。 在 PostgreSQL 官方 手 
册 的 “创建 运算 符 ” 一 节 中 ， 你 可 以 看 到 系统 允许 使 用 哪些 字符 来 定 
义 新 的 运算 符 。 


运算 符 不 仅仅 是 其 底层 实现 函数 的 别名 ， 它 还 可 以 提供 一 些 可 以 大 
助 规划 器 更 好 工作 的 优化 信息 ， 规 划 需 借助 这 些 信息 可 以 判定 如 何 
使 用 索引 ， 如 何以 最 低 的 成 本 访问 数据 ， 以 及 哪些 运算 符 表 达 式 是 
等 价 的 。 这 些 信息 的 完整 列表 以 及 每 一 类 信息 的 具体 作用 ， 可 以 参 
考官 方 手册 中 “运算 符 的 优化 信息 ”一 市 的 内 容 。 


创建 运算 符 的 第 一 步 是 创建 其 后 层 实现 函数 ， 如 示例 5-59 所 示 。 





























示例 5-59 ”为 complex_number 创建 底层 实现 函数 


CREATE OR _ REPLACE FUNCTION add(complex number, complex_number) 
RETURNS complex number AS 
$$ 


SELECT 
((COALESCE(($1).r,0) + COALESCE( ($2).r,0)), 


(COALESCE(($1).i,68) + COALESCE(($2).i,0)))::complex number; 
$$ 
language sdql; 





接 下 来 要 创建 一 个 运算 符 来 代表 此 函数 ， 如 示例 5-60 所 示 。 
示例 5-60 ”为 complex_number 类 型 定义 + 运算 符 


CREATE OPERATOR + ( 
PROCEDURE = add， 
LEFTARG = complex_number, 
RIGHTARG = complex_number., 
COMMUTATOR = + 

); 





然后 我 们 测试 一 下 这 个 新 的 + 运算 符 : 


SELECT (1,2)::complex number + (3,-10)::complex number; 





输出 结果 是 (4, -8) 。 


虽然 我 们 在 此 处 没有 举例 说 明 ， 但 你 可 以 对 函数 和 运算 符 进行 重 
载 ， 以 使 其 可 以 接受 多 种 不 同类 型 的 输入 。 例 如 ， 你 可 以 创建 一 个 
支持 complex_number 和 integer 相 加 的 add 函数 和 相应 的 + 计 
算 符 ， 这 就 实现 了 对 原 逻 辑 的 扩展 。 


支持 自 定义 数据 类 型 和 运算 符 让 PostgreSQL 从 机 制 上 具有 了 自我 
演进 的 能 力 ， 开 源 社区 无 数 开发 人 员 利 用 此 能 力 为 PostgreSQL 和 平 





台 谎 砖 加 拟 。 随 着 这 个 开发 平 合 的 羽 避 日 渐 丰 满 ， 我 们 离 “ 一 切 香 
以 表 驱 动 * 的 理想 境界 也 越 来 越 近 。 


01. 


第 6 章 表 、 约 束 和 索引 


表 是 关系 型 数据 库存 储 体系 的 基本 单元 。 设 计 好 结构 化 的 表 并 且 定 
义 表 与 表 之 间 的 关联 关系 是 关系 型 数据 库 的 核心 设计 思想 。 在 
PostgreSQL 中 ， 约 束 定义 了 表 与 表 之 间 的 关系 。 与 以 堆 结 构 存 储 的 
记录 相 比 ， 表 的 优势 束 在 于 有 索引 。 你 会 在 很 多 书 的 末尾 看 到 词汇 
索引 表 ， 也 会 在 写字 楼 的 大 尝 看 到 每 层 楼 的 租户 名 单 ， 表 索引 的 作 
用 与 它们 类 似 ， 即 在 表 中 快速 得 找到 目标 数据 的 位 置 ， 这 样 就 不 用 
每 次 查询 时 都 扫描 整 张 表 的 内 容 。 


本 章 将 介绍 创建 表 和 插入 记录 的 语法 。 然 后 将 介绍 约束 的 用 法 ， 约 
束 可 以 保证 数据 库 的 记录 不 会 违反 我 们 制定 的 规则 。 最 后 将 展示 如 
何 为 表 创 建 索引 来 加 速 查询 。 在 表 上 创建 索引 是 需要 经 过 深思 熟 虑 
的 ， 因 为 一 个 错误 的 索引 会 导致 查询 效果 比 全 表 扫 描 还 兰 ， 也 就 是 
说 创建 了 还 不 如 不 创建 。 并 不 是 所 有 的 索引 都 是 “生来 平等 ?的 ， 数 
据 库 领域 的 算法 专家 为 不 同 的 数据 类 型 设计 出 了 不 同类 型 的 索引 ， 
目的 是 将 碍 询 的 速度 提升 到 极致 。 


























01. 6.1 表 
除了 普通 的 表 以 外 ，PostgreSQL 还 提供 了 许多 不 常见 的 表 ， 具 体 包 
括 临 时 表 、 无 日 志 表 、 继 承 表 、 基 于 复合 类 型 的 表 以 及 外 部 表 (第 
10 章 将 介绍 外 部 表 ) 。 
6.1.1 基本 的 建 表 操作 


示例 6-1 演示 了 建 表 语 法 ， 在 所 有 文 持 SQL 的 数据 库 中 建 表 语 法 
都 是 类 似 的 。 


示例 6-1 基本 的 建 表 操 作 








CREATE TABLE logs ( 

1og id serial PRIMARY KEY, © 

user_name varchar(506), @ 

description text, © 

log ts timestamp with time zone NOT NULL DEFAULT current timestamp 


2 
CREATE INDEX idx logs log ts ON logs USING btree (log ts); 








@ serial 数据 类 型 是 一 种 自 增长 的 数字 类 型 。 建 表 时 如 果 有 一 个 
serial 类 型 的 字段 ， 那 么 系统 会 自动 在 schema 中 同时 创建 一 个 对 
应 的 序列 号 生成 器 。serial 类 型 字段 的 值 是 一 个 整 型 数字 ， 它 会 
自动 被 赋值 为 序列 写生 成 器 的 下 一 个 值 。 每 张 表 一 般 来 说 只 会 有 一 
个 serial 字段 ， 日 一 般 用 作 主 键 。 对 于 特别 大 的 表 ， 应 该 使 用 
bigserial 类 型 ， 因 为 它 能 容纳 的 数值 上 限 更 大 。 


四 varchar 是 character varying〈 可 变 长 字符 串 ) 的 简写 ， 其 定义 
与 其 他 数据 库 产品 中 的 定义 类 似 。 你 可 以 不 为 varchar 字段 设 定 
最 大 长 度 值 ， 此 时 它 与 text 类 型 几乎 是 一 样 的 。 

全 text 是 一 种 不 定 长 度 的 字符 串 ， 无 最 大 长 度 限 制 。 


@@timestamp with time zone (可 简写 为 timestamptz ) 是 
一 种 表示 日 期 和 时 间 的 类 型 ， 总 是 以 国际 标准 时 间 (UTC) 格式 存 














储 。 该 类 型 在 显示 时 总 是 以 服务 器 当前 所 在 时 区 为 基准 进行 显示 ， 
当然 你 也 可 以 要 求 使 用 指定 的 时 区 进行 显示 。 更 多 关于 此 类 型 的 讨 
论 ， 请 参考 5.3.1 节 。 





PostgreSQL 10 中 新 增 了 对 IDENTITY 关键 字 的 支持 。IDENTITY 也 
可 以 将 字段 定义 为 自 增 序列 号 类 型 ， 这 是 一 种 更 加 符合 标准 的 语 
人 


你 可 以 将 现 有 的 log_id 字段 的 serial 类 型 修改 为 IDENTITY 类 
型 。 与 serial 不同 的 是 ，IDENTITY 类 型 的 底层 不 再 借助 一 个 自 
动 生成 的 序列 号 生成 器 。 语 法 如 下 : 





DROP SEQUENCE logs log id seq CASCADE; 
ALTER TABLE logs 


ALTER COLUMN log id ADD GENERATED BY DEFAULT AS IDENTITY; 





如 果 此 表 中 已 有 数据 ， 需 要 防止 序列 号 再 次 从 1 生成 从 而 造成 重 


ALTER TABLE logs 
ALTER COLUMN log_id RESTART WITH 2666; 





如 果 是 创建 新 表 ， 要 按照 如 示例 6-2 所 示 的 IDENTITY 语法 创建 
表 ， 不 用 原来 的 serial 语法。 


示例 6-2 ”使 用 IDENTITY 语法 创建 表 


CREATE TABLE logs ( 

log_ id int GENERATED BY DEFAULT AS IDENTITY PRIMARY KEY， 
user_name Varchar(56)， 

description text， 


log ts timestamp with time zone NOT NULL DEFAULT current timestamp 
) ; 





示例 6-2 的 语法 结构 与 示例 6-1 基本 相同 ， 只 是 更 详细 。 


那么 在 什么 情况 下 应 该 使 用 IDENTITY 蔡 代 serial 昵 ? IDENTITY 
语法 的 主要 优点 在 于 一 个 identity 总 是 与 所 属 表 绑 定 的 ， 其 值 的 递 
增 或 者 重 置 都 是 与 表 本 身 一 体 化 管理 的 ， 不 会 受 其 他 对 象 干 

扰 。serial 类 型 则 不 是 这 样 ， 它 会 在 后 台 自 动 创建 一 个 序列 号 生 
成 器 ， 这 个 序列 号 生成 器 可 以 与 别 的 表 共 享 也 可 以 本 表 独 享 ， 当 不 
需要 该 序列 号 生成 器 时 需要 手动 删除 它 。 如 果 你 需要 重 置 一 个 
serial 类 型 字段 的 初始 值 ， 需 要 修改 后 台 那 个 自动 生成 的 序列 号 
生成 器 ， 这 也 意味 着 得 先知 道 那 个 序列 号 生成 器 的 名 字 。 很 显然 ， 
这 个 管理 过 程 比 IDENTITY 要 繁琐 很 多 。 


当 需 要 在 多 张 表 之 间 共 享 一 个 递增 序列 号 时 ，serial 类 型 依然 是 
很 有 用 的 。 这 种 情况 下 ， 需 要 创建 一 个 独立 的 序列 号 生成 器 ， 并 把 
需要 共享 该 序列 的 每 张 表 的 相应 字段 的 默认 值 设 为 该 序列 号 生成 器 
的 下 一 个 值 。 从 内 部 实现 机 制 来 看 ，IDENTITY 语法 与 serial 类 
型 的 做 法 其 实 是 类 似 的 ， 都 是 自动 创建 一 个 序列 号 生成 器 ， 只 不 过 
IDENTITY 不 会 将 这 个 序列 号 生成 器 对 象 暴露 给 外 界 去 修改 。 


6.1.2 ”继承 表 


PostgreSQL 是 唯一 提供 表 继 承 功 能 的 数据 库 。 如 果 创 建 一 张 表 〈 子 
表 ) 时 指定 为 继承 自 男 一 张 表 ( 父 表 ) ， 则 建 好 的 子 表 除了 含有 自 
己 的 字段 外 还 会 含有 父 表 的 所 有 字段 。PostgreSQL 会 记录 下 这 个 继 
承 关 系 ， 这 样 一 旦 父 表 的 结构 发 生 了 变化 ， 子 表 的 结构 也 会 自动 跟 
着 变化 。 这 种 父子 继承 结构 的 表 可 以 完美 地 适用 于 需要 数据 分 区 的 
场景 。 当 查询 父 表 时 ，PostgreSQL 会 自动 把 子 表 的 记录 也 取出 来 。 
值得 注意 的 是 ， 并 不 是 所 有 父 表 的 特征 都 会 被 子 表 继承 下 来 ， 比 如 
主 表 的 主键 约束 、 唯 一 性 约束 以 及 索引 就 不 会 被 继承 。check 约束 
会 被 继承 ， 但 子 表 还 可 以 男 建 自己 的 check 约束 〈( 详 见 示例 6- 

3) 。 
































示例 6-3 ”创建 继承 表 





CREATE TABLE logs _2611 (PRIMARY KEY (log id)) INHERITS (logs); 
CREATE INDEX idx logs 2611 log ts ON logs_2611 USING btree(log ts) 
ALTER TABLE 1ogs_2611 
ADD CONSTRAINT chk_y2611 
CHECK ( 
log ts >= '20611-1-1'::timestamptz AND log ts < '20612-1-1'::timesta 


); ©O 


@O 我 们 定义 了 一 个 check 约束 来 限制 只 能 录入 2011 年 的 数据 。 该 
check 约束 告诉 查询 规划 器 在 查询 父 表 时 跳 过 不 满足 条 件 的 子 表 。 


PostgreSQL 9.5 新 增 文 持 了 在 本 地 表 和 外 部 表 之 间 做 表 继 承 ， 而 且 
可 以 互相 继承 。 文 持 该 特性 主要 是 为 了 实现 表 的 分 布 式 存储 。 


6.1.3 ”原生 分 区 表 支 持 


PostgreSQL 10 中 增加 了 对 原生 分 区 表 功 能 的 支持 。 原 生 分 区 表 从 
使 用 上 看 与 之 前 的 表 继 承 功 能 非常 类 似 ， 都 允许 把 数据 切 分 到 多 张 
独立 的 子 表 中 ， 并 且 规 划 器 会 选择 性 地 跳 过 不 符合 查询 条 件 的 子 

i 
法 不 同 。 


尽管 在 很 多 场景 下 分 区 表 都 可 以 苦 代 诛 来 的 表 继 承 功 能 ， 但 还 不 能 
完全 蔡 代 。 以 下 是 表 继 承 和 分 区 表 这 两 个 功能 的 关键 区 别 。 


。 分 区 表 使 用 声明 式 的 CREATE TABLE .. PARTITION BY 
RANGE .. 语法 ， 后 台 会 默认 创建 一 个 分 区 表 组 。 

。 使 用 分 区 表 时 ， 如 果 对 主 表 插入 数据 ， 记 录 会 按照 分 区 规则 被 

路 由 到 相应 的 分 区 中 。 但 使 用 表 继 承 时 情况 就 不 是 这 样 ， 你 需 

要 直接 把 数据 插入 正确 的 子 表 中 ， 或 者 在 主 表 上 挂 载 触 发 器 来 

把 记录 路 由 到 子 表 中 。 

分 区 表 的 所 有 子 分 区 都 必须 具备 相同 的 字段 结构 ， 而 表 继 承 中 

的 子 表 完 全 可 以 比 父 表 拥 有 更 多 字段 。 

分 区 表 的 每 个 分 区 都 隶属 于 一 个 共同 的 分 区 表 组 ， 这 意味 着 它 

们 只 能 有 一 个 父 表 ， 然 而 表 继 承 功能 中 的 一 张 子 表 可 以 继承 自 

多 个 父 表 。 

分 区 表 的 父 表 是 一 个 逻辑 对 象 而 非 物理 实体 ， 因 此 它 上 面 不 可 

以 定义 主键 、 唯 一 键 或 者 索引 ， 但 是 每 个 子 分 区 可 以 定义 这 

些 。 表 继承 机 制 中 的 情况 与 此 不 同 : 父 表 和 每 个 子 表 都 可 以 有 

主键 ， 而 且 主 键 只 需 在 本 表 内 部 唯一 即 可 ， 并 不 一 定 要 在 所 有 

子 表 范 围 内 都 唯一 。 

与 表 继 承 机 制 中 的 父 表 不 同 ， 分 区 表 的 父 表 不 能 存储 自己 的 记 






































录 。 上 所 有 针对 父 表 插 入 的 记录 都 会 被 路 由 到 相应 的 子 分 区 中 ， 
如 果 没 有 符合 条 件 的 子 分 区 则 会 报错 。 


我 们 将 使 用 分 区 表 语 法 重建 示例 6-1 中 的 logs 表 ， 其 中 会 用 分 区 
语法 来 创建 子 分 区 ， 而 不 会 使 用 示例 6-3 所 示 的 表 继 承 语法 。 


首先 ， 删 除 现 有 的 logs 表 及 其 所 有 子 表 : 


DROP TABLE IF EXISTS logs CASCADE; 


创建 分 区 表 时 ， 必 须 使 用 PARTITION BY 语法 来 表明 这 是 一 个 分 区 
表 ， 语 法 如 示例 6-4 所 示 。 可 以 对 比 看 一 下 示例 6-1， 其 中 我 们 先 
创建 了 一 张 普通 表 。 男 外 ， 请 注意 我 们 并 没有 定义 主键 ， 因 为 分 区 
表 的 主 表 并 不 支持 主键 。 


示例 6-4 ”创建 分 区 表 的 主 表 





CREATE TABLE logs ( 

log id int GENERATED BY DEFAULT AS IDENTITY, 
user_name Varchar(56)， 

description text, 


log ts timestamp with time zone NOT NULL DEFAULT current timestamp 
) PARTITION BY RANGE (log ts); 





与 表 继 承 机 制 类 似 的 是 ， 分 区 表 机 制 中 也 需要 单独 创建 子 分 区 表 ， 
不 同 之 处 是 使 用 了 FOR VALUES 语法 来 指明 每 张 子 表 能 容纳 的 数据 
范围 ， 而 表 继 承 中 使 用 的 是 check 约束 。 我 们 在 示例 6-5 中 把 示例 
6-3 的 内 容重 演 一 遍 ， 只 不 过 采用 的 是 FOR VALUES FROM 语法 而 
韭 INHERITS 语法 。 


示例 6-5 ”创建 子 分 区 





CREATE TABLE logs_2611 PARTITION OF logs © 

FOR VALUES FROM ('2611-1-1') TO ('2012-1-1') @; 

CREATE INDEX idx logs 2611 log ts ON logs_2611 USING btree(log ts); © 
ALTER TABLE logs_2611 ADD CONSTRAINT pk_logs 2811 PRIMARY KEY (log_id) 


| | 
@ 定义 一 张 新 表 ， 作 为 logs 表 的 一 个 子 分 区 。 

@ 定义 该 分 区 中 能 够 存储 的 数据 范围 。 子 分 区 之 间 的 数据 存储 范 

围 不 能 有 重 登 ， 如 果 违 反 此 规则 ， 子 分 区 的 CREATE TABLE 语句 会 
失败 。 


@@@ 子 分 区 表 上 可 以 定义 索引 和 主键 。 与 表 继 承 类 似 的 是 ， 子 分 
区 表 的 主键 并 不 需要 在 所 有 子 分 区 表 中 全 局 唯一 。 


如 果 尝 试 插 入 如 下 的 记录 : 


INSERT INTO logs(user name, description ) VALUES ('regina', 'Sleeping' 


语句 会 因 找 不 到 合适 的 分 区 而 报 这 个 错 ， 

















ERROR: no partition of relation "logs" found for row 
DETAIL: Partition key of the failing row contains 
(log ts) = (2617-65-25 62:58:28.657161-64) . 





接 下 来 为 当前 年 份 再 创建 一 个 分 区 : 


CREATE TABLE logs gt 2611 PARTITION OF logs 
FOR VALUES FROM ('2612-1-1') TO (unbounded); 





这 里 与 示例 6-5 不 同 的 地 方 是 使 用 了 unbounded 关键 字 来 表示 分 
区 的 截止 范围 ， 这 样 将 来 的 日 期 也 都 能 匹配 到 这 个 分 区 。 


再 执行 一 次 前 面 的 插入 语句 ， 这 次 会 成 功 。 执 行 SELECT * FROM 
logs_gt_2611; 查询 就 可 以 看 到 记录 被 路 由 到 了 新 建 的 分 区 中 。 


请 注意 ， 在 实际 项 目 中 不 是 只 创建 完 分 区 就 可 以 ， 我 们 需要 针对 新 
建 的 分 区 创建 索引 和 主键 以 提升 查询 效率 。 








与 表 继 承 机 制 类 似 的 是 ， 当 查询 父 表 时 ， 所 有 不 符合 条 件 的 子 分 区 
都 会 被 跳 过 ， 如 示例 6-6 所 示 。 


示例 6-6 ”规划 器 上 自动 跳 过 不 符合 条 件 的 分 


xl 


EXPLAIN ANALYZE SELECT * FROM logs WHERE log ts > '20617-65-061'; 


Append (cost=6.66..15.25 rows=146 width=162) 
(actual time=0.008. .0.669 rows=1 loops=1) 
-> Seq Scan on 1ogs_gt_26011 (cost=6.660..15.25 Fows=146 width=162) 


(actual time=0.008. .0.668 rows=1 loops=1) 

Filter: (log ts > "2017-65-61 00:606:66-64'::timestamp with 七 im 
Planning time: 6.152 ms 
Execution time: 8.022 ms 





如 果 你 使 用 的 是 PostgreSQL 10 目 带 的 PSQL， 针 对 分 区 表 执 行 表 
结构 查询 命令 时 将 得 到 更 为 详细 的 信息 ， 在 这 些 信息 中 能 看 到 每 个 
分 区 能 容纳 数据 的 范围 。 








\d+ logs 
Table "public.logs" 


Partition key: RANGE (log ts) 


Partitions: logs 2811 
FOR VALUES FROM ('2611-061-61 060:60:600-65') TO ('20612-61-61 66:66:6 
logs_gt 2811 
FOR VALUES FROM ('2612-61-61 060:66:66-65') TO (UNBOUNDED) 





6.1.4 无 日 志 表 


对 于 发 生 磁 盘 故 障 或 者 系统 朋 误 后 可 以 被 重建 的 临时 数据 来 说 ， 其 
操作 速度 比 可 靠 性 更 重要 。PostgreSQL 从 9.1 版 开始 支持 
UNLOGGED 修饰 符 ， 使 用 该 修饰 符 可 以 创建 无 日 志 的 表 ， 如 示例 6- 
7 所 示 。 系 统 不 会 为 这 种 表 记 录 任 何事 务 日 志 〈 业 界 一 般 也 称 为 
WAL 日 志 ， 即 write-ahead log) 。 无 日 志 表 的 一 大 优势 是 其 写 入 记 
录 的 速度 远 远 超 过 普通 的 有 日 志 表 ， 依 照 我 们 的 经 验 ， 大 概 会 快 








10 到 15 倍 。 


如 果 你 的 服务 需 不 小 心 被 掉 电 重 局 ， 那 么 无 日 志 表 中 的 数据 会 在 事 
务 回 滚 过 程 中 被 全 部 清除 。 无 日 志 表 的 另 一 个 特性 是 它 无 法 被 纳入 
PostgreSQL 的 复制 机 制 ， 因 为 复制 机 制 依赖 事务 日 志 。pg_dump 
有 一 个 选项 可 以 允许 你 跳 过 备份 无 日 志 的 表 。 


示例 6-7 ”创建 无 日 志 表 


CREATE UNLOGGED TABLE web sessions ( 
session id text PRIMARY KEY, 
add ts timestamptz, 


upd ts timestamptz, 
session state xml); 





使 用 无 日 志 表 还 有 一 些 别 的 缺点 。 在 PostgreSQL 9.3 之 前 ， 无 日 志 

表 不 支持 GiST 索引 (参考 6.3.1 节 ) ， 该 类 型 的 索引 一 般 适 用 于 高 

级 的 数据 类 型 ， 比 如 数组 、 范 围 、JSON、 全 文 检索 以 及 空间 类 型 

| PostgreSQL 版 本 中 的 无 日 志 表 都 可 以 使 用 B- 树 索引 
1 GIN 索引 。 


在 PostgreSQL 9.5 之 前 ， 要 想 把 无 日 志 表 改 为 有 日 志 表 是 很 麻烦 
的 。9.5 版 之 后 ， 只 需 执 行 以 下 命令 即 可 : 


ALTER TABLE some_ table SET LOGGED; 


6.1.5 TYPE OF 
PostgreSQL 在 创建 一 张 表 时 ， 会 自动 在 后 台 创 建 一 个 结构 完全 相同 


的 复合 数据 类 型 ， 反 之 则 不 是 这 样 。 你 可 以 使 用 一 个 复合 数据 类 型 
0 下 面 将 演示 该 功能 ， 首 移 创建 一 个 复合 数据 类 


CREATE TYPE basic user AS (user name varchar(56), pwd varchar(16) ) ; 














然后 可 以 创建 一 张 表 ， 表 结构 束 是 该 复合 类 型 ， 如 示例 6-8 所 示 。 
示例 6-8 ”以 复合 数据 类 型 为 模板 来 创建 一 张 表 


CREATE TABLE super users OF basic user (CONSTRAINT pk_su PRIMARY KEY ( 


当 基 于 数据 类 型 来 创建 表 时 ， 你 不 能 指定 表 字 段 的 定义 ， 一切 以 数 
据 类 型 本 身 的 定义 为 准 。 然 而 ， 为 复合 数据 类 型 新 增 或 者 移 除 字 段 
时 ，PostgreSQL 会 自动 修改 相应 的 表 结 构 。 这 种 机 制 的 优点 是 ， 如 
果 你 的 系统 中 有 很 多 结构 相同 的 表 ， 而 你 可 能 需要 同时 对 所 有 表 结 
构 进 行 相同 的 修改 ， 那 么 此 时 只 雷 要 修改 此 基础 数据 类 型 即 可 ， 这 
一 点 与 表 继 承 机 制 很 相似 。 


例如 ， 如 果 需 要 为 示例 6-8 中 定义 的 super_users 表 增 加 一 个 电 
话 写 码 字 段 ， 那 么 只 需 执 行 以 下 语句 即 可 。 


ALTER TYPE basic user ADD ATTRIBUTE phone varchar(16) CASCADE; 


一 般 来 说 ， 如 果 表 依赖 于 某 个 类 型 ， 那 么 你 就 不 能 更 改 该 类 型 的 定 
修饰 符 凌 轰 于 此 限制 之 上 ， 对 所 有 相关 表 应 用 相同 的 
改 。 


























01. 6.2 ”约束 机 制 


PostgreSQL 的 约束 机 制 是 我 们 所 接触 过 的 数据 库 中 最 先进 的 ， 同 时 
也 是 最 复杂 的 。 用 户 可 以 在 创建 约束 时 定制 其 各 方面 的 属性 ， 包 括 
约束 的 名 称 、 如 何 处 理 现 有 数据 、 级 联 生 效 条 件 选 项 、 如 何 执行 匹 
配 算法 、 使 用 哪些 索引 以 及 在 何 种 情况 下 约束 可 以 不 生效 等 。 关 于 
完整 的 约束 规则 ， 建 议 你 查阅 PostgreSQL 官方 手册 中 的 相关 内 

容 。 昌 然 约 束 机 制 中 有 大 量 的 选项 可 供 定制 ， 但 一 般 来 说 没 那么 复 
采用 默认 选项 就 够 了 。 本 市 将 首先 介绍 关系 型 数据 库 领域 是 熟 
详 的 几 个 概念 ， 包 括 外 键 约束 、 唯 一 性 约束 以 及 check 约束 ， 然 
后 再 介绍 排他 性 约束 。 








豆 灌 堪 





做、 主键 约束 和 字段 唯一 性 约束 在 表 级 范围 内 不 允许 出 现 重 
名 。 一 般 比 较 推 荐 的 做 法 是 把 表 名 和 字段 名 加 入 到 约束 的 名 称 
中 ， 这 样 吏 不 会 重复 。 为 简洁 起 见 ， 下 面 的 例子 中 可 能 不 会 遵 
循 这 种 做 法 。 


6.2.1 ”外 键 约束 
与 大 多 数 支 持 引 用 完整 性 的 数据 库 一 样 ，PostgreSQL 遵循 与 其 相同 
的 约定 。 你 可 以 指定 级 联 更 新 和 删除 规则 以 避免 出 现 讨 厌 的 孤立 记 
录 。 示 例 6-9 中 展示 了 如 何 添 加 外 键 约 束 。 

示例 6-9 建立 外 键 约束 和 相应 的 索引 








SET search path=census, public; 
ALTER TABLE facts ADD CONSTRAINT fk facts 1 FOREIGN KEY (fact type_id) 
REFERENCES lu fact types (fact type id) @ ON UPDATE CASCADE ON DELETE 


CREATE INDEX fki facts 1 ON facts (fact type id); © 





@ 我 们 在 facts 表 和 1lu_fact_types 表 之 间 定 义 了 一 个 外 键 约束 
关系 。 有 了 这 个 约束 以 后 ， 如 果 主 表 lu_fact_types 中 不 存在 某 
fact_type_id 的 记录 ， 那 么 从 表 fact 中 就 不 能 插入 该 


fact_type_id 的 记录 。 


四 我 们 定义 了 一 个 级 联 规则 ， 实 现 了 以 下 功能 : (1) 如 果 主 表 

lu_ fact _ type 的 fact_type_id 字段 值 发 生 了 变化 ， 那 么 从 表 
fact 中 相应 记录 的 fact_type_id 字段 值 会 自动 进行 相应 修改 ， 
以 维持 外 键 引用 关系 不 变 ; (2) 如 果 从 表 fact 中 还 存在 某 
fact_type_id 字段 值 的 记录 ， 那 么 主 表 lu_fact_type 中 相同 
fact_type_id 字段 值 的 记录 就 不 允许 被 删除 。ON DELETE 
RESTRICT 是 默认 行为 模式 ， 也 就 是 说 这 个 子 句 不 加 也 可 以 ， 但 为 
了 清晰 起 见 最 好 加 上 。 


全 PostgreSQL 在 建立 主键 约束 和 唯一 性 约束 时 ， 会 自动 为 相应 字 
段 建立 索引 ， 但 在 建立 外 键 约束 时 却 不 会 ， 这 一 点 需要 注意 。 你 需 
要 为 外 键 字 段 手 动 建立 索引 ， 以 加 快 关 联 引用 时 的 得 询 速度 。 


外 键 约束 对 于 保证 数据 完整 性 是 很 重要 的 。 在 比较 新 的 PostgreSQL 
版 本 中 ， 它 还 能 起 到 帮助 规划 优化 处 理 逻 辑 的 作用 。 在 PostgreSQL 
9.6 中 ， 规 划 需 的 一 个 改进 就 是 利用 外 键 关 系 来 推 新 表 关 联 语句 中 
谓词 的 可 选择 性 ， 提 升 了 许多 类 型 查询 的 效率 。 


6.2.2 ”唯一 性 约束 


主键 字段 的 值 是 唯一 的 ， 但 每 张 表 只 能 定义 一 个 主键 ， 因 此 如 果 你 
需要 保证 别 的 字段 值 唯一 ， 那 么 必须 在 该 字段 上 建立 唯一 性 约束 或 
者 唯一 索引 。 建 立 唯一 性 约束 时 会 自动 在 后 台 创 建 一 个 相应 的 唯一 
索引 。 与 主键 字段 类 似 ， 建 立 了 唯一 性 约束 的 字段 可 以 作为 外 键 字 
段 被 别 的 表 引 用 ， 但 它 可 以 为 空 。 不 过 请 注意 : 建 了 唯一 索引 却 没 
有 唯一 性 约束 的 字段 是 可 以 输入 空 值 的 ， 而 且 还 可 以 使 用 函数 来 定 
义 。 下 面 的 例子 演示 了 如 何 新 建 一 个 唯一 性 约束 。 


ALTER TABLE logs_2611 ADD CONSTRAINT uq UNIQUE (user name, log ts); 


你 可 能 经 常会 遇 到 仪 需 要 保证 表 中 部 分 记录 行 唯一 的 情况 ， 
PostgreSQL 不 文 持 带 沛 选 条 件 的 唯一 性 约束 ， 但 你 可 以 通过 使 用 唯 
一 性 的 部 分 索引 来 达到 相同 的 目的 。 详 情 请 参见 6.3.4 节 。 

















6.2.3 check 约束 


check 约束 能 够 给 表 的 一 个 或 者 多 个 字段 加 上 一 个 条 件 ， 表 中 每 一 
行 记录 必须 满足 此 条 件 。 查 询 规 划 器 也 会 利用 check 约束 来 优化 执 
行 速度 ， 比 如 有 些 查 询 附带 的 条 件 与 待 查询 表 的 check 约束 无 交 

集 ， 那 么 规划 器 会 立即 认定 该 查询 未 命中 目标 并 返回 。 示 例 6-3 中 
就 有 一 个 check 约束 ， 该 约束 可 以 告诉 规划 器 不 要 试图 查找 不 符合 
约束 条 件 的 记录 。check 约束 支持 基于 函数 和 布尔 表达 式 的 条 件 ， 

因此 你 可 以 发 挥 创 意 编写 出 一 个 非常 复杂 的 约束 条 件 来 。 例 如 ， 以 
下 check 约束 可 以 限制 logs 表 中 所 有 用 户 名 必须 都 小 写 。 


ALTER TABLE logs ADD CONSTRAINT chk CHECK (user_name = lower(user_name 


特别 值得 注意 的 一 点 是 ， 当 表 间 存在 继承 关系 时 ， 子 表 会 继承 父 表 
的 check 约束 ， 但 主键 、 外 键 、 唯 一 性 这 三 种 约束 却 不 会 继承 。 


6.2.4 排他 性 约束 


传统 的 唯一 性 约束 在 比较 算法 中 仅 使 用 了 “等 于 ”运算 符 ， 即 保证 了 
指定 字段 的 值 在 本 表 的 任意 两 行 记录 中 都 不 相等 ， 而 排他 性 约束 机 
制 拓展 了 唯一 性 比较 算法 机 制 ， 可 以 使 用 更 多 的 运算 符 来 进行 比较 
运算 ， 该 类 约束 特别 适用 于 解决 有 关 时 间 安 排 的 问题 。 


PostgreSQL 9.2 中 引入 了 区 间 数 据 类 型 ， 该 类 型 特别 适合 使 用 排他 

性 约束 。 你 可 以 在 depesz 站 点 的 “Waiting for 9.2 Range Data 

人 中 ， 找 到 在 区 间 数 据 类 型 上 使 用 排他 性 约束 的 非常 
的 例子 。 


排他 性 约束 一 般 是 基于 GiST 类 型 的 索引 来 实现 的 ， 使 用 基于 B- 树 
算法 的 GiST 多 列 复合 索引 也 是 可 以 的 ， 不 过 需要 先 安装 
btree_gist 扩展 包 才 能 建立 这 种 索引 。 多 列 排他 性 约束 的 一 个 经 
典 应 用 场景 就 是 用 于 安排 资源 。 


以 下 是 一 个 使 用 排他 约束 的 例子 。 假 设 你 的 办 公 场 所 有 固定 数量 的 
会 议 室 ， 各 项 目 组 在 使 用 会 议 室 前 必须 预订 。 示 例 6-10 演示 了 如 
何 避 免 友 生 预 订 冲突 。 该 示例 中 使 用 了 && 运算 符 来 判定 时 间 区 段 






































是 否 重 个 ， 还 使 用 了 = 运算 符 来 判定 会 议 室 房间 号 是 人 否 重 复 ， 请 注 
意 观 察 和 思考 此 用 法 。 


示例 6-10 ”防止 会 议 室 预订 冲突 


CREATE TABLE schedules(id serial primary key, room int, time slot tstz 
ALTER TABLE schedules ADD CONSTRAINT ex_schedules 


EXCLUDE USING gist (room WITH =, time slot WITH &&); 





同 唯一 性 约束 一 样 ，PostgreSQL 会 目 动 为 排他 性 约束 中 涉及 的 字段 
建立 索引 。 


排他 性 约束 适用 的 另 一 个 场景 是 处 理 数组 类 型 的 数据 。 假 设 有 若干 
房间 要 分 配给 一 群 人 搞 聚 会 ， 我 们 把 一 场 聚 会 所 使 用 的 房间 称 为 一 
个 block。 方 便 起 见 ， 我 们 为 每 个 聚会 生成 一 条 记录 ， 但 需要 确保 
两 场 聚会 不 会 共享 同一 个 房间 。 建 表 如 下 : 


CREATE TABLE room blocks(block id integer primary key, rooms int[]); 


为 保证 每 两 个 block 之 间 不 会 有 共享 的 房间 ， 可 以 设置 一 个 排他 性 
约束 来 防止 分 配 重 登 。 很 遗憾 的 是 ， 排 他 性 约束 仅 对 GiST 索引 类 
型 生效 ， 而 GiST 索引 又 不 支持 在 数组 上 建立 ， 所 以 我 们 先 安装 一 
个 扩展 包 ， 如 示例 6-11 所 示 。 


示例 6-11 防止 数组 block 重 县 








CREATE EXTENSION IF NOT EXISTS intarray; 
ALTER TABLE room blocks 
ADD CONSTRAINT ex_ room blocks rooms 


EXCLUDE USING gist(rooms WITH &&); 





intarray 扩展 包 的 功能 是 文 持 在 整 型 数组 〈 文 持 int4 和 int8 ) 
上 建立 GiST 索引 。intarray 安装 好 以 后 就 可 以 对 数组 类 型 的 数 
据 建 并 GiST 了 ， 接 着 就 可 以 在 整 型 数组 数据 上 建立 排他 性 约束 。 


01. 6.3 索引 


PostgreSQL 的 索引 机 制 功 能 强大 、 特 性 丰富 ， 仅 仅 索引 部 分 的 内 容 
已 足够 写 一 本 大 部 头 的 书 。PostgreSQL 原生 支持 若干 种 类 型 的 索 
引 。 如 果 你 觉得 还 不 够 ，PostgreSQL 还 允许 你 为 这 几 种 索引 类 型 自 
定义 新 的 索引 运算 符 和 修饰 符 以 作为 其 功能 补充 。 如 果 这 样 还 不 能 
满足 你 的 要 求 ， 你 可 以 创建 自己 的 索引 类 型 。 


PostgreSQL 还 文 持 在 同一 张 表 中 混合 搭配 不 同 的 索引 类 型 ， 且 预计 
规划 器 将 综合 考虑 所 有 的 索引 。 例 如 ， 在 一 个 字段 上 建立 B- 树 索 
引 ， 在 劳 边 的 字段 上 建立 GiST 索引 ， 查 询 时 两 个 索引 都 可 以 被 用 
上 。 要 更 深入 了 解 规划 器 对 索引 的 选用 机 制 ， 请 参考 PostgreSQL 
官方 手册 中 “位 图 索引 扫 摘 策略 ”一 节 的 内 容 。 


普通 表 和 物化 视图 上 均 可 创建 索引 ， 但 外 部 表 不 行 。 




















俯 、 同一 schema 内 的 索引 名 不 能 重复 。 


6.3.1 PostgreSQL 原生 支持 的 索引 类 型 


要 想 利 用 好 PostgreSQL 的 索引 能 力 ， 需 要 和 多 了 解 其 文 持 的 不 同 的 
索引 类 型 以 及 它们 各 自 适 用 的 场景 。PostgreSQL 原生 支持 的 索引 类 
型 包括 以 下 几 种 。 


B- 树 索引 


B- 树 是 一 种 关系 型 数据 库 中 常见 的 通用 索引 类 型 。 如 果 你 对 别 
的 索引 类 型 不 感 兴趣 ， 那 么 一 般 使 用 B- 树 索引 就 可 以 了 。 有 的 场 
景 下 PostgreSQL 会 自动 创建 驼 引 《比如 创建 主键 约束 或 者 唯一 性 
约束 时 ) ， 那 么 创建 出 来 的 索引 就 是 B- 树 类 型 的 ;， 如果 你 自己 创 
建 索 引 时 未 指定 索引 类 型 ， 那 么 默认 也 会 创建 B- 树 类 型 的 索引 。 
主键 约束 和 唯一 性 约束 唯一 文 持 的 后 台 索 引 就 是 B- 树 索引 。 


BRIN 索引 














BRIN (block range index， 块 范围 索引 ) 是 PostgreSQL 9.4 中 


引入 的 一 种 索引 类 型 ， 其 设计 目的 是 针对 超大 表 做 索引 ， 在 这 种 表 
上 创建 B- 树 索引 耗费 的 空间 过 大 ， 以 至 于 无 法 全 部 容纳 在 内 存 
中 ， 这 会 导致 内 存 和 磁盘 间 的 索引 数据 块 换 入 换 出 ， 从 而 严重 影响 
查询 速度 。BRIN 索引 的 思路 就 是 把 一 个 范围 内 的 数据 页 面 当 作 一 
个 单元 来 处 理 ， 这 样 就 可 以 大 大 压缩 需要 索引 的 目标 单元 数 。 
BRIN 索引 占用 的 空间 要 比 B- 树 索引 和 其 他 索引 小 得 多 ， 同 时 建立 
起 来 也 更 快 。 但 其 查询 时 的 速度 相对 较 慢 ， 也 不 能 用 于 确保 唯一 主 
键 ， 另 外 还 有 一 些 场景 页 不 适用 该 类 索引 。 


GiST 索引 











GiST (generalized search tree， 通 用 搜索 树 ) 主要 的 适用 场景 
包括 全 文 检索 以 及 空间 数据 、 科 学 数据 、 非 结构 化 数据 和 层次 化 数 
据 的 搜索 。 该 类 索引 不 能 用 于 保障 字段 的 唯一 性 ， 也 就 是 说 建立 了 
该 类 型 索引 的 字段 上 可 插入 重复 值 ， 但 如 果 把 该 类 索引 用 于 排他 性 
约束 就 可 以 实现 唯一 性 保障 。 


GiST 是 一 种 有 损 索 引 ， 也 惑 是 说 它 不 存储 被 索引 字段 的 值 ， 
而 仅仅 存储 字段 值 的 一 个 取样 ， 这 种 取样 是 失真 的 ， 就 像 把 一 个 盒 
子 变 成 了 一 个 多 边 形 。 这 就 意味 着 圾 要 一 个 额外 的 查找 步 又 以 获得 
真正 记录 的 值 。 


GIN 索引 


GIN (generalized inverted index， 通 用 逆序 索引 ) 主要 适用 于 
PostgreSQL 内 置 的 全 文 搜 索引 擎 以 及 二 进 制 json 数据 类 型 。 其 他 
一 些 扩 展 包 (比如 hstore 和 pg_ trgm ) 也 会 使 用 这 种 索引 。GIN 
其 实 是 从 GiST 浜 生出 来 的 一 种 索引 类 型 ， 但 它 是 无 损 的 ， 也 就 是 
说 索引 中 会 包含 有 被 索引 字段 的 值 。 如 果 你 需要 碍 询 的 字段 都 已 被 
索引 ， 那 么 只 读 取 索 引 即 可 获取 查询 结果 ， 这 种 情况 下 GIN 的 但 
询 速度 是 快 于 GiST 的 。 然 而 ， 由 于 GIN 比 GiST 在 更 新 操作 时 要 
多 出 一 个 字段 值 复制 动作 ， 因 此 此 时 GIN 索引 体积 更 大 并 且 更 新 
速度 慢 于 GiST 索引 。 另 外 ，GIN 的 索引 树 内 部 每 一 个 索引 行 的 长 
上 度 是 有 限制 的 ， 所 以 它 不 能 用 于 对 hstore 文档 或 者 text 等 大 对 象 
类 型 进行 索引 。 如 果 你 需要 把 一 个 600 页 的 手册 内 容 存 入 一 张 表 的 
某 个 字段 ， 那 么 绝对 不 要 在 该 字段 上 建立 GIN 类 型 的 索引 。 

在 “Waiting for Faster LIKE/ILIKE 符 ” 这 篇 文章 中 有 一 个 关于 GIN 用 
法 的 非常 好 的 例子 可 供 你 参考 。 在 9.3 版 中 ， 用 于 实现 字符 串 模糊 















































匹配 和 相似 度 查 询 的 pg_trgm 扩展 包 中 做 了 一 个 功能 强化 : 支持 
正则 表达 式 条 件 查询 时 用 上 GIN 索引 ， 这 大 大 增加 了 pg_trgm 的 
适用 场景 。 


SP-GiST 索引 





SP-GiST 是 指 基于 空间 分 区 树 (space-partitioning trees) 算法 
的 GiST 索引 。 该 类 型 的 索引 与 GiST 索引 的 适用 领域 相同 ， 但 对 
于 某 些 特定 领域 的 数据 算法 ， 其 效率 会 更 高 一些。PostgreSQL 的 
point 和 box 等 原生 几何 类 型 以 及 text 类 型 是 最 先 文 持 该 类 索引 
的 数据 类 型 。 从 9.3 版 开始 ， 区 间 类 型 也 开始 文 持 此 类 型 的 索引 。 


散 列 索引 


散 列 索引 在 GiST 和 GIN 索引 出 现 前 就 已 经 得 到 了 广泛 使 用 。 
业界 普 裔 认为 GiST 和 GIN 索引 在 性 能 和 事务 安全 性 方面 要 胜 过 散 
列 索 引 。PostgreSQL 10 之 前 的 版 本 中 ， 事 务 日 志 中 不 会 记录 散 列 
索引 的 变化 ， 那 么 在 流 式 复制 环境 中 就 不 能 使 用 散 列 索引 ， 否 则 会 
导致 修改 无 法 被 同步 。 尽 管 有 一 段 时 期 散 列 索引 被 PostgreSQL 官 
方 列 为 不 推荐 使 用 状态 ， 但 是 在 PostgreSQL 10 中 它 再 次 得 到 了 强 
化 。 该 版 本 中 ， 散 列 索引 强化 了 事务 一 致 性 以 及 一 些 性 能 提升 ， 有 
的 场景 中 它 会 比 B- 树 更 快 。 


基于 B- 树 算法 的 GiST 和 GIN 索引 


如 果 你 想 了 解 PostgreSQL 除了 原生 索引 以 外 还 有 哪些 索引 ， 
不 管 是 出 于 业务 需要 还 是 仅仅 出 于 好 奇 ， 都 可 以 从 了 解 基 于 B- 树 
算法 的 GiST 和 GIN 索引 开始 。 二 者 都 可 以 用 扩展 包 形 式 安 装 ， 并 
且 大 多 数 PostgreSQL 发 行 版 中 都 含有 这 两 个 扩展 包 。 这 两 类 混合 
算法 索引 的 优势 在 于 ， 它 们 既 能 够 支持 GiST 和 GIN 索引 特有 的 运 
算 符 ， 又 具有 B- 树 索引 对 于 “等 于 ”运算 符 的 良好 支持 。 当 需要 建立 
同时 包含 简单 和 复杂 数据 类 型 的 多 列 复 合 索 引 时 ， 你 会 发 现 这 两 类 
索引 不 可 或 缺 。 例 如 ， 我 们 建立 的 复合 索引 中 既 有 普通 文本 类 型 也 
有 full-text 类 型 1 。 一 般 来 说 ， 类 似 全 文 检 索 、1ltree 
、geometric 和 空间 类 型 这 些 高 级 数据 类 型 ， 只 能 使 用 GIN 或 者 
GiST 索引 ， 因 此 这 类 字段 不 可 能 与 只 能 建立 B- 树 索引 的 普通 字段 
构成 复合 索引 。 此 时 基于 这 两 种 索引 就 可 以 实现 这 个 目标 ， 基 于 它 
们 的 混合 算法 可 以 把 建立 了 GiST 索引 的 字段 和 建立 了 B- 树 索引 的 






































字段 联合 起 来 ， 组 成 为 单一 的 复合 索引 。 


1PostgreSQL 没有 full-text 类 型 这 种 说 法 ， 此 处 作者 指 的 是 tsvector 和 tsquery 这 两 
种 专用 于 全 文 检索 的 数据 类 型 。 一 一 译 者 注 











除了 PostgreSQL 原生 附带 的 索引 类 型 外 ， 还 有 一 些 额外 的 索引 类 
型 以 扩展 包 形 式 存在 。 其 中 比较 流行 的 是 VODKA 和 RUM (基于 
GIN 索引 的 一 个 变种 ) 这 两 种 ， 适 用 于 PostgreSQL 9.6 以 及 之 后 的 
版 本 。RUM 索引 适用 于 full-text 之 类 的 复杂 类 型 ， 如 果 你 需要 全 
文 词 组 搜索 ， 那 么 就 必须 使 用 RUM 类 型 。 另 外 ， 它 还 提供 了 一 些 
距离 运算 符 。 


为 一 个 索引 类 型 是 pgroonga， 它 以 扩展 包 的 形式 存在 ， 当 前 仪 支持 
PostgreSQL 9.5 和 PostgreSQL 9.6。 该 扩展 把 作为 全 文 搜索 引擎 同 
时 也 是 一 个 列 式 存储 容器 的 roonga 的 能 力 带 入 了 PostgreSQL 。 
PGRoonga 扩展 包 中 含有 一 个 名 为 pgroonga 的 索引 类 型 以 及 相应 的 
运算 符 。PGRoonga 扩展 可 以 实现 对 普通 文本 进行 索引 ， 以 文 持 对 
其 进行 全 文 检 索 ， 但 不 像 PostgreSQL 原生 的 全 文 检索 机 制 那样 需 
要 创建 全 文 检索 向 量 。PGRoonga 还 能 够 实现 让 ILIKE 和 LIKE 
'%something%'" 这 种 操作 用 上 上 索引， 效果 类 似 于 pg_trgm 扩展 。 
此 外 ， 它 还 支持 对 数组 类 型 和 JSONB 类 型 建立 索引 。Linux/Unix 
和 Windows 下 该 扩展 都 有 可 用 的 安装 包 。 














6.3.2 ”运算 符 类 


大 多 数 人 即使 不 知道 < 运算 符 类 ?是 什么 以 及 它 与 款 引 有 什么 天 系 ， 
也 能 坚 无 障碍 地 使 用 索引 。 但 如 果 你 运气 没 这 么 好 ， 也 就 是 说 你 的 
应 用 场景 需要 你 了 解 这 些 内 容 ， 那 么 就 得 好 好 研究 运算 符 类 了 ， 人 否 
则 就 会 一 二 被 这 个 问题 困扰 :“ 为 什么 规划 强 没 用 上 我 的 索引 ? ” 


各 种 数据 类 型 均 有 目 身 的 特点 ， 因 此 适用 的 索引 类 型 不 同 ， 会 用 到 
的 比较 运算 符 也 不 同 。 例 如 ， 对 于 基于 区 间 类 型 (range) 的 索引 
来 说 ， 最 第 用 的 运算 符 是 重合 运算 符 〈(&& ) ， 然 而 该 运算 符 对 于 
本 文 搜索 领域 来 说 却 毫 无 意义 。 对 于 中 文 这 类 表意 文字 来 说 ， 建 立 
的 索引 基本 上 不 会 用 到 “不 等 于 "运算 符 ; 而 对 英文 这 类 表 音 文字 建 
立 索 引 时 ， 字 母 A 到 2Z 的 排序 操作 是 不 可 或 缺 的 。 


基于 以 上 特点 ，PostgreSQL 把 一 类 应 用 领域 相近 的 运算 符 以 及 这 些 






































运算 符 适 用 的 数据 类 型 组 合 在 一 起 ， 称 为 一 个 运算 符 类 。 例 

如 ，int4_ops 运算 符 类 包含 适用 于 int4 (也 就 是 日 第 所 说 的 
integer ) 类 型 的 = < > > < 运算 符 。PostgreSQL 提供 了 一 张 叫 
作 pg_class 的 系统 表 ， 从 中 可 以 查 到 完整 的 运算 符 类 列表 ， 其 中 
既 包 含 了 系统 原生 支持 的 类 ， 也 包含 了 通过 扩展 包机 制 添加 的 类 。 
一 种 类 型 的 索引 会 使 用 特定 的 否 干 种 运算 符 类 。 完 整 的 运算 符 列表 
可 以 从 pgAdmin 界面 上 的 运算 符 类 分 文 下 看 到 ， 也 可 以 根据 
system catalog 在 示例 6-12 中 执行 查询 得 到 。 


示例 6-12 ”查询 B- 树 索引 文 持 的 数据 类 型 以 及 运算 符 类 








SELECT am.amname AS index method, opc.opcname AS opclass name, 
opc.opcintype: :regtype AS indexed type, opc.opcdefault AS is default 
FROM pg _ am am INNER JOIN pg opclass opc ON opc.opcmethod = am.oid 
WHERE am.amname = 'btree' 

ORDER BY index method, indexed type, opclass name; 


index_method | opclass name indexed type | is default 


bool ops boolean 


text ops text 
text_ pattern ops text 
varchar_ops text 
varchar_pattern ops text 








在 示例 6-12 中 ， 仪 查询 了 B- 树 的 相关 数据 。 请 注意 ， 每 类 索引 都 
会 有 多 个 运算 符 类 ， 而 其 中 仅 有 一 个 会 被 标记 为 默认 运算 符 类 。 如 
果 建 立 索 引 时 未 指定 使 用 哪个 运算 符 类 ， 那 么 PostgreSQL 会 使 用 

ee 绝 大 多 数 情况 下 这 么 做 是 没什么 问题 的 ， 但 并 非 绝 
对 如 此 。 


例如 ，B- 树 索引 默认 的 text_ops 运算 符 类 (又 名 varchar_ops 
) 中 并 不 支持 ~~ 运算 符 ( 即 LIKE 运算 符 ) ， 所 以 如 果 创 建 B- 树 
索引 时 选择 了 该 运算 符 类 ， 那 么 所 有 使 用 LIKE 的 查询 都 无 法 在 
text_ops 运算 符 类 中 使 用 索引 。 因 此 ， 如 果 你 的 业务 场景 需要 对 
varchar 或 者 text 类 型 进行 大 量 LIKE 模糊 查询 ， 那 么 创建 索引 
时 最 好 显 式 指定 使 用 text_pattern_ops 或 者 


varchar_pattern_ops 这 两 个 运算 符 闫 。 指 定 运算 符 类 的 语法 很 
简单 ， 只 需要 在 创建 索引 时 加 在 被 索引 字段 名 的 后 面 即 可 ， 参 考 示 
例如 下 。 


CREATE INDEX idx1 ON census.lu tracts USING btree (tract name text pat 


和 在 示例 6-12 的 查询 结果 中 ， 你 可 能 已 经 注意 到 了 B- 树 索 
引 的 varchar_ops 和 text_ops 两 种 运算 符 类 适用 的 数据 类 
型 都 是 text ， 这 样 来 看 的 话 ，varchar_ops 貌似 有 点 名 不 副 
实 。 这 是 因为 varchar 类 型 本 质 上 就 是 加 了 长 度 限制 的 text 
类 型 ， 二 者 可 以 共用 一 套 运算 符 。varchar_ops 和 
varchar_pattern_ops 实质 上 就 是 text_ops 和 
text_pattern_ops 的 别名 ， 之 所 以 把 前 面 两 种 单列 出 来 是 因 
为 varchar 毕竟 是 单独 的 一 种 数据 类 型 ， 存 在 一 种 以 其 类 型 
命名 的 专属 运算 符 类 看 起 来 会 比较 合理 。 


最 后 请 牢记 这 一 条 : 你 创建 的 每 一 个 索引 都 只 会 使 用 一 个 运算 符 


类 。 如 果 希 望 一 个 字段 上 的 索引 使 用 多 个 运算 符 类 ， 那 么 请 创建 多 
个 索引 。 要 将 默认 索引 text_ops 添加 到 表 中 ， 请 运行 以 下 代码 : 


CREATE INDEX idx2 ON census.lu tracts USING btree (tract name); 


现在 ， 在 同一 个 字段 上 就 有 了 多 个 索引 《单个 字段 上 可 建立 的 索引 
个 数 是 没有 限制 的 ) 。 规 划 器 处 理 等 值 查询 时 会 使 用 idx2 ， 处 理 
1ike 模糊 查询 时 会 使 用 idx1 。 


你 可 以 在 PostgreSQL 官方 手册 中 找到 关于 运算 符 类 的 更 详细 的 描 


述 。 另 外 ， 我 们 也 强烈 建议 你 阅读 一 下 我 们 的 博客 文章 “Why is My 
Index Not Used?”。 


6.3.3 ”函数 索引 
PostgreSQL 的 函数 索引 功能 可 以 基于 字段 值 的 函数 运算 结果 建立 索 
































引 。 函 数 索 引 的 用 途 也 是 很 广泛 的 ， 例 如 可 用 于 对 大 小 写 混 杂 的 文 
本 数据 建立 索引 。PostgreSQL 是 一 个 区 分 大 小 写 的 数据 库 ， 如 果 要 
实现 不 区 分 大 小 写 的 查询， 可 以 借助 如 下 的 函数 索引 : 


CREATE INDEX idx ON featnames short 
USING btree (upper(fullname) varchar _ pattern ops); 


在 下 面 的 碍 询 语 句 中 ， 我 们 使 用 了 前 面 建立 索引 时 使 用 的 upper 
函数 来 将 fullname 字段 变 为 大 写 后 ， 再 进行 条 件 比较 。 由 于 得 询 
语句 中 使 用 的 函数 与 我 们 在 建立 索引 时 使 用 的 函数 相同 ， 因 此 规划 
峰会 对 此 碍 询 语句 使 用 索引 : 


SELECT fullname FROM featnames short WHERE upper(fullname) LIKE 'S%'; 


外 注意 ， 碍 询 语句 中 使 用 的 函数 要 与 建立 函数 索引 时 使 用 
的 函数 完全 一 致 ， 这 样 才 能 保证 用 上 索引 。 


6.3.4 基于 部 分 记录 的 索引 


基于 部 分 记录 的 索引 〈 有 时 也 称 为 已 筛选 索引 ) 是 一 种 仅 针对 表 中 
部 分 记录 的 索引 ， 而 且 这 部 分 记录 需要 满足 WHERE 语句 设置 的 得 
选 条 件 。 例 如 ， 假 设 某 表 中 有 1 000 000 条 记录 ， 但 你 只 会 查询 其 
中 一 个 记录 数 为 10 000 的 子 集 ， 那 么 该 场景 就 非常 适合 使 用 基于 
部 分 记录 的 索引 。 这 种 索引 比 全 量 索 引 快 ， 因 为 其 体积 小 ， 所 以 可 
以 把 更 多 索引 数据 缓存 到 内 存 中 。 另 外 ， 该 类 索引 占用 的 磁盘 空间 


更 小 。 




















基于 部 分 记录 的 索引 能 够 实现 仅 针对 部 分 记录 的 唯一 性 约束 。 举 个 
例子 ， 假 设 你 手 上 有 一 家 报纸 在 过 去 10 年 间 的 订阅 用 户 数据 ， 现 
在 需要 确保 还 在 订阅 的 用 户 不 会 每 天 多 拿 一 份 报纸 。 由 于 人 们 对 纸 
媒 的 兴趣 下 降 ， 因 此 这 10 年 间 的 全 量 订阅 用 户 中 仅 有 5% 还 在 坚 
持 订 阅 。 所 以 ， 很 显然 你 不 需要 关注 那些 已 经 退 订 的 用 尸 ， 因 为 他 
们 的 姓名 早已 从 报纸 递送 员 手 上 的 递送 名 单 中 崭 除 。 表 结构 如 下 : 








CREATE TABLE subscribers ( 
id serial PRIMARY KEY， 
name varchar(56) NOT NULL, type varchar(56)， 
is active boolean)j; 














我 们 建立 一 个 基于 当前 活跃 用 户 的 部 分 记录 索引 即 可 : 


CREATE UNIQUE INDEX uq ON subscribers USING btree(lower(name)) WHERE i 


仆 、 索引 的 WHERE 条 件 中 使 用 的 函数 必须 是 确定 性 函数 ， 

即 固定 的 输入 一 定 能 够 得 到 固定 输出 的 函数 。 这 意味 着 有 几 类 
函数 是 不 能 用 作 旬 选 条 件 的 : 一 类 是 CURRENT_DATE 这 种 输出 
结果 不 停 在 变 的 函数 ， 一 类 是 依赖 于 其 他 表 数 据 进行 运算 的 函 
数 ， 其 输出 结果 受 其 他 表 的 数据 的 影响 ， 因 此 输出 也 是 不 固定 
的 ; 还 有 一 类 是 依赖 当前 表 中 的 其 他 记录 行进 行 运 算 的 函数 ， 
其 输出 也 不 会 受 控 。 


需要 特别 强调 的 一 点 是 ， 当 使 用 SELECT 语句 查询 数据 时 ， 要 想 规 
划 需 用 上 部 分 记录 索引 ， 那 么 该 查询 语句 的 WHERE 条 件 中 必须 包 

含 创建 部 分 记录 索引 时 所 使 用 的 WHERE 条 件 ， 如 果 该 索引 同时 还 

征 个 函数 索引 ， 那 么 该 查询 语句 的 WHERE 条 件 中 必须 包含 建立 索 

引 时 所 使 用 的 函数 。 前 面 例子 中 创建 的 部 分 数据 索引 同时 也 是 个 函 
数 索 引 ， 因 为 条 件 中 使 用 了 lower 函数 而 不 是 仅 使 用 了 name 字 

段 。 这 个 逻辑 实际 操作 起 来 比较 麻烦 也 容易 出 错 ， 有 一 个 办 法 可 以 
让 事情 变 得 简单 一 些 ， 那 就 是 建立 一 个 视图 ， 视 图 条 件 就 是 建立 过 
引 的 条 件 ， 那 么 针对 此 视图 进行 查询 就 永远 不 会 漏 掉 条 件 了 。 还 是 
以 前 述 报纸 订阅 用 户 数据 为 例 ， 建 立 如 下 视图 : 


CREATE OR REPLACE VIEW vw_ subscribers current AS 
SELECT id, lower(name) As name FROM subscribers WHERE is active = true 


然后 将 针对 原 表 的 查询 都 改 为 针对 此 视图 的 查询 即 可 (一 种 比较 激 
进 的 观点 认为 ， 此 种 情况 下 永远 都 不 应 该 直接 碍 询 原 表 ) 。 视 图 的 






































本 质 就 是 一 个 保存 下 来 的 查询 语句 ， 创 建 视 图 时 所 用 的 WHERE 条 
件 以 及 其 中 的 函数 条 件 部 分 都 会 被 完整 代入 到 任何 针对 该 视图 的 碍 
询 语句 中 。 当 然 查 询 视图 的 语句 也 可 以 包含 额外 的 查询 条 件 ， 这 些 
过 滤 条 件 最 后 都 会 生效 。 针 对 前 面 我 们 刚刚 创建 的 视图 来 说 ， 和 碍 询 
视图 的 语句 通过 两 个 代入 步骤 后 即 可 被 翻译 为 针对 基 表 的 查询 语 

人 句 ， 之 后 就 可 以 用 上 基础 表 的 部 分 数据 索引 。 这 两 个 步 又 分 别 为 : 
首先 把 查询 语句 中 的 name 字段 映射 到 基础 表 的 lower (name)， 

这 样 查 询 视 图 的 name 字段 就 等 同 于 查询 视图 基础 表 的 

lower (name) ; 然后 把 创建 视图 时 的 is_active=true 条 件 添加 
到 原始 的 视图 查询 语句 中 。 这 样 代 入 后 的 语句 就 可 以 用 上 基础 表 的 
部 分 数据 索引 了 : 


SELECT * FROM vw_ subscribers current WHERE name = "sandy 


你 可 以 查看 规划 器 输出 的 执行 计划 以 确认 你 的 索引 是 否 被 用 上 了 。 
6.3.5 ”多 列 索 引 


在 本 章 前 面 的 内 容 中 ， 你 应 该 已 经 见 到 了 大 量 多 列 索引 《也 称 为 复 
合 索 引 *) 的 例子 。 请 注意 ， 也 可 以 基于 多 个 字段 来 创建 函数 索 
引 。 以 下 征 一 个 多 列 索 引 的 示例 。 


?复合 索引 的 多 个 字段 中 也 可 以 包含 函数 ， 此 时 建立 的 索引 既是 复合 索引 也 是 函数 索 
引 。 一 一 译 者 注 


CREATE INDEX idx ON subscribers 
USING btree (type, upper(name) varchar_pattern_ops) ; 


PostgreSQL 的 规划 器 在 语句 执行 过 程 中 会 自动 使 用 一 种 被 称 为 “位 
图 索引 扫描 ”的 策略 来 同时 使 用 多 个 索引 。 该 策略 可 以 使 得 多 个 单 
列 索 引 同时 发 挥 作用 ， 达 到 的 效果 与 使 用 单个 复合 索引 相同 。 如 果 
你 不 能 确定 业务 的 应 用 模式 是 以 单列 作为 查询 条 件 的 场景 多 一 些 ， 
还 是 同时 以 多 列 作为 查询 条 件 的 场景 多 一 些 ， 那 么 最 好 针对 可 能 作 
为 查询 条 件 的 每 个 列 单独 建立 索引 ， 这 是 最 灵活 的 做 法 ， 规 划 器 会 












































决定 如 何 组 合 使 用 这 些 索 引 。 


假设 你 建 了 一 个 B- 树 多 列 索引 ， 其 中 包含 type 和 upper(name) 
两 个 字段 ， 那 么 完全 没 必要 针对 type 字段 再 单独 建立 一 个 索引 ， 
因为 规划 器 即使 在 遇 到 只 有 type 单字 段 的 查询 条 件 时 ， 也 会 自动 
使 用 该 多 列 索引 ， 这 是 规划 器 的 一 项 基本 能 力 。 如 果 碍 询 条 件 字 段 
没有 从 多 列 索引 中 的 第 一 个 字段 开始 匹配 ， 规 划 堪 其 实 也 能 用 上 索 
个 字段 开始 匹配 才 是 最 高 效 的 。 


规划 器 文 持 一 种 仅 依赖 索引 内 数据 的 查询 策略 (index-only 

scan) ， 也 就 是 说 如 果 碍 询 的 目标 字段 在 索引 内 都 有 ， 那 么 直接 扫 
摘 索 引 就 可 以 得 到 查询 结果 ， 根 本 不 需要 访问 表 的 本 体 了 。 这 个 功 
能 的 引入 使 得 复合 索引 的 作用 更 为 凸显 ， 因 为 复合 索引 可 以 提供 更 
多 数据 ， 因 此 更 适合 使 用 此 种 查询 方法 。 如 果 你 的 业务 场景 中 查询 
的 目标 字段 和 条 件 字 上 段 是 相同 的 那 几 个 ， 那 么 束 应 该 建立 复合 索引 
以 提升 查询 速度 。 不 过 ， 索 引 中 包含 的 字段 越 多 也 就 意味 着 索引 占 
人 
小 合 索 引 。 





























01. 


第 7 半 PostgreSQL 的 特色 SQL 
语法 


PostgreSQL 在 对 ANSI SQL 标准 的 遵从 方面 已 经 远 远 走 在 了 其 他 数 
据 库 的 前 面 。 除 了 适 配 标准 之 外 ，PostgreSQL 还 提供 了 类 型 多 样 的 
强化 语法 ， 这 些 强化 包括 易 用 的 简化 语法 以 及 一 些 前 卫 到 足以 打破 
关系 型 SQL 边界 的 语法 特性 。 通 过 这 些 努 力 ，PostgreSQL 保持 了 
领先 地 位 。 本 章 将 介绍 一 些 其 他 数据 库 中 很 少见 的 SQL 语法 特 
性 。 和 希望 你 已 有 一 定 的 SQL 开发 经 验 ， 和 否则 可 能 无 法 理解 
PostgreSQL 为 简化 SQL 开发 工作 所 做 的 努力 。 


01. 7.1 视图 


一 个 设计 良好 的 关系 型 数据 库 中 的 表 存 储 的 是 规范 化 的 数据 ， 因 此 
当 需 要 从 多 张 表 中 获取 数据 时 ， 就 需要 写 关 联 和 查询 的 SQL 语句 。 
如 采 你 的 应 用 场景 需要 反复 执行 这 种 关联 碍 询 语 句 ， 可 以 考虑 创建 
人 
TBE DJ 。 


有 人 认为 用 户 不 应 该 直接 访问 表 ， 而 应 该 通过 视图 来 访问 ， 不 过 这 
就 意味 着 需要 为 每 张 表 都 创建 一 个 视图 。 这 种 做 法 的 优点 是 在 表 的 
本 体 之 上 增加 了 一 个 访问 层 ， 简 化 了 权限 管理 且 使 得 业务 逻辑 抽象 
更 容易 ， 缺 点 束 是 太 麻 烦 。 我 们 认为 这 个 观点 是 合理 的 ， 但 事实 上 
由 于 惰性 很 少 有 人 会 这 么 做 。 


PostgreSQL 的 视图 功能 近年 来 有 了 长 足 的 发 展 。9.3 版 中 推出 了 可 
目 动 更 新 的 视图 。 如 果 你 的 视图 是 基于 单 表 的 ， 并 且 视 图 字段 中 包 
含 了 基础 表 的 主键 字段 ， 那 么 殉 可 以 直接 对 此 视图 执行 UPDATE 操 
作 ， 视 图 的 基础 表 数 据 将 随 之 更 新 。 


9.3 版 中 还 引入 了 物化 视图 。 每 个 视图 都 对 应 一 个 SQL 查询 语句 ， 
视图 本 质 上 就 是 该 SQL 的 查询 结果 集 的 一 个 别名 。 每 次 访问 视图 
时 都 需要 执行 其 对 应 的 SQL， 但 物化 视图 将 视图 逻辑 映射 后 的 数据 
记录 实际 存储 下 来 ， 这 样 访问 物化 视图 时 就 省 略 了 视图 底层 SQL 
的 执行 过 程 ， 就 像 访问 一 张 本 地 表 一 样 。 一 旦 物化 视图 建立 好 以 
后 ， 只 有 对 它 执行 REFRESH 操作 时 才 会 再 次 从 基础 表 中 读 取 数 
据 。 根 据 前 面 的 描述 可 以 知道 ， 使 用 物化 视图 可 以 节省 计算 资源 ， 
因为 视图 底层 SQL (这 种 SQL 还 辑 可 能 极其 复杂 ) 不 用 反复 执 
行 。 但 物化 视图 也 有 缺点 ， 因 为 如 果 刷 新 不 及 时 ， 就 会 导致 取出 的 
数据 可 能 不 是 最 新 的 ， 还 有 一 个 问题 就 是 物化 视图 刷新 期 间 会 不 可 
访问 。 

9.4 版 开始 支持 用 户 在 物化 视图 刷新 时 也 能 对 其 进行 访问 ， 该 版 本 


还 引入 了 WITH CHECK OPTION 修饰 符 ， 用 于 防止 在 视图 的 范围 之 
外 进行 插入 和 更 新 。 


7.1.1 单 表 视 图 












































最 简单 的 视图 是 从 单个 表 得 出 的 。 如 果 打 算 将 数据 写 回 到 该 表 ， 请 
始终 包含 主键 ， 如 示例 7-1 所 示 。 


示例 7-1 创建 基于 单 表 的 视图 





CREATE OR REPLACE VIEW census.vw facts 2611 AS 
SELECT fact type id, val, yr, tract id FROM census.facts WHERE yr = 26 





自从 9.3 版 起 ， 就 可 以 使 用 INSERT 、UPDATE 和 DELETE 命令 在 该 
视图 中 更 改 数据 了 。 更 新 和 删除 命令 将 遵从 作为 视图 一 部 分 的 任何 
WHERE 条 件 。 例 如 ， 下 面 的 删除 命令 将 仅 删 除 val 字段 值 为 0 的 记 


DELETE FROM census.vw facts _ 2611 WHERE val = 0; 


| 
数据 ， 


UPDATE census.vw facts _ 2611 SET val = 1 WHERE yr = 20812; 


请 注意 ， 针 对 视图 插入 的 数据 可 能 不 会 被 包含 在 视图 可 见 范围 内 ; 
针对 视图 的 更 新 操作 也 会 发 生 类 似 现象 ， 即 更 新 后 的 数据 不 再 被 包 
含 在 视图 的 可 见 范 围 内 ， 如 示例 7-2 所 示 。 


示例 7-2 “针对 视图 进行 UPDATE 操作 ， 修 改 后 的 数据 不 再 落 
在 视图 可 见 范围 内 


UPDATE census.vw facts 2011 SET yr = 26012 WHERE yr = 20811; 


示例 7-2 中 的 UPDATE 语句 操作 的 目标 记录 是 落 在 视图 可 见 范围 内 
的 ， 但 更 新 后 会 把 本 来 落 在 视图 可 见 范围 内 的 记录 变 成 落 到 视图 可 



































见 范围 之 外 ， 也 就 是 说 视图 更 新 后 少 了 一 条 记录 。 但 为 了 保持 视图 
数据 的 一 致 性 ， 我 们 不 希望 这 种 情况 发 生 ， 也 就 是 说 希望 更 新 后 的 
数据 仍然 应 该 落 在 视图 可 见 范 围 内 ， 因 此 任何 会 导致 这 种 情况 发 生 
的 插入 或 者 更 新 操作 都 应 被 禁止 。 这 可 以 通过 9.4 版 中 引入 的 WITH 
CHECK OPTION 子 句 来 实现 。 创 建 视图 时 如 果 附 带 了 此 子 句 ， 那 么 
此 视图 中 插入 的 数据 或 者 更 新 后 的 数据 落 在 视图 可 见 范 围 之 外 时 ， 
系统 会 报错 ， 违 反 了 该 约束 的 操作 会 失败 。 下 面 我 们 将 限定 
vs_facts_2811 视图 仅 人 允许 插 入 2011 年 的 数据 ， 同 时 不 允许 将 
yr 字段 修改 为 2011 以 外 的 其 他 值 。 我 们 修改 一 下 视图 定义 ， 把 这 
个 约束 加 上 ， 语 法 如 示例 7-3 所 示 。 


示例 7-3 ”创建 带 有 WITH CHECK OPTION 约束 的 单 表 视图 











CREATE OR REPLACE VIEW census.vw facts 2811 AS 
SELECT fact type_ id, val, yr, tract_ id FROM census.facts 


WHERE yr = 2611 WITH CHECK OPTION; 





尝试 执行 以 下 更 新 操作 : 


UPDATE census.vw facts 2611 SET yr = 26012 WHERE val > 2942; 


你 会 看 到 这 样 的 报错 信息 : 


ERROR: new row violates WITH CHECK OPTION for view"vw_ facts 2811" 
DETAIL: Failing row contains (1, 25606106165606，206012，2985.6060，1606.060). 





7.1.2 ”使 用 触发 器 来 更 新 视图 


视图 可 以 将 针对 多 张 表 的 关联 查询 封装 为 针对 视图 的 简单 查询 。 如 
果 视 图 的 基础 表 有 多 张 ， 那 么 直接 更 新 该 视图 是 不 允许 的 ， 因 为 多 
张 表 必 然 带 来 的 问题 就 是 操作 要 沙 到 哪个 基础 表 上 ，PostgreSQL 是 
无 法 自动 判定 的 。 假 设 你 有 一 个 视图 ， 该 视图 基于 一 张 国 家 信息 表 
和 一 张 省 份 信息 表 ， 此 时 你 希望 删除 该 视图 的 一 条 记录 ， 











PostgreSQL 无 法 得 知 你 到 底 想 要 仅 删 除 一 条 国家 记录 ， 还 是 仅 删 除 
一 个 省 份 记录 ， 抑 或 是 删除 一 个 国家 以 及 该 国家 对 应 的 所 有 省 的 记 
录 。PostgreSQL 无 法 目 动 判定 你 想 做 什么 并 不 代表 了 束 不 能 对 这 种 复 
杂 视 图 进行 修改 操作 ， 你 可 以 通过 编写 触发 器 来 对 这 些 操 作 进行 转 
义 处 理 ， 转 义 后 的 逻辑 中 可 以 体现 你 的 意图 。 


我 们 首先 建立 一 个 关联 了 两 张 表 的 视图 ， 如 示例 7-4 所 示 。 
示例 7-4 ”创建 vw_facts 视图 








CREATE OR REPLACE VIEW census.vw facts AS 

SELECT 
y.fact type id, y.category, y.fact subcats, y.short name, 
x.tract _ id, x.yr, x.val, x.perc 


FROM census.facts As x INNER JOIN census.lu fact types As y 
ON x.fact type id = y.fact type_ id; 








要 实现 通过 触及 器 来 更 新 视图 这 一 目标 ， 需 要 定义 一 个 或 者 多 个 
INSTEAD OF 触发 器 来 实现 针对 INSERT 、UPDATE 、DELETE 这 三 
大 基本 操作 的 转 义 处 理 。 值 得 一 提 的 是 ，PostgreSQL 文 持 基于 
TRUNCATE 事件 的 触发 器 。 触 发 器 需要 有 一 个 基础 图 数 ， 你 可 以 使 
用 除 SQL 外 的 任何 语言 来 编写 该 基础 函数 ， 其 命名 也 没有 规则 限 
制 。 我 们 在 示例 7-5 中 选择 使 用 PL/pgSQL 语法 来 编写 。 


示例 7-5 在 vw facts 视图 上 创建 一 个 对 INSERT 、UPDATE 
、DELETE 操作 进行 转 义 处 理 的 函数 














CREATE OR _ REPLACE FUNCTION census.trig vw facts ins upd del() RETURNS 


IF (TG OP = 'DELETE') THEN © 
DELETE FROM census.facts AS f 
WHERE 
f.tract id = OLD.tract id AND f.yr = OLD.yr AND 
f.fact type _ id = OLD.fact type_id; 
RETURN OLD; 
END IF; 
IF (TG OP = 'INSERT') THEN @ 
INSERT INTO census.facts(tract id, yr, fact type id, val, perc 
SELECT NEW.tract id, NEW.yr, NEW.fact type_id, NEW.val, NEW.pe 


RETURN NEW; 

END IF; 

IF (TG OP = 'UPDATE') THEN © 
IF 


ROW(OLD.fact type_id, OLD.tract id, OLD.yr, OLD.val, OLD.p 
ROW(NEW.fact_ type_id, NEW.tract id, NEW.yr, NEW.val, NEW.p 


THEN @ 
UPDATE census.facts AS f 
SET 
tract_ id = NEW.tract id， 
yr = NEW.yr, 
fact type_id = NEW.fact type_ id, 
val = NEW.val, 
perc = NEW.perc 
WHERE 
f.tract id = OLD.tract id AND 
f.yr = OLD.yr AND 
f.fact type_id = OLD.fact type_id; 
RETURN NEW; 
ELSE 
RETURN NULL; 
END IF; 


LANGUAGE plpgsql VOLATILE; 





录 。 


“OLD 记录 是 指 原 始 的 针对 视图 的 删除 动作 所 要 删除 的 视图 记录 。 也 就 是 说 ，0LD 记录 是 

















视图 记录 ， 而 非 视 图 基础 表 的 记录 。 译 者 注 








四 对 插入 操作 进行 转 义 处 理 。 


人 @ 对 删除 操作 进行 转 义 处 理 ， 筛 选 条 件 的 字段 取 值 来 源 于 OLD 记 





全 对 更 新 操作 进行 转 义 处 理 。 根 据 0LD 记录 的 内 容 判 断 哪些 记录 


要 更 新 为 NEW 记录 。” 


? NEW 记录 指 的 是 原始 的 针对 视图 的 更 新 动作 设置 的 修改 后 的 视 
记录 是 视图 记录 ， 而 非 视图 基础 表 的 记录 。 一 一 译 者 注 





























图 记录 。 也 就 是 说 ，NEW 


@ 比较 0LD 记录 和 NEW 记录 的 字段 值 ， 只 有 二 者 不 一 样 时 才 真 正 


执行 更 新 动作 。 


接 下 来 ， 我 们 将 此 触发 占 函 数 绑 定 到 视图 上 ， 语 法 如 示例 7-6 所 
示 。 


示例 7-6 ”将 触 友 需 函 数 绑 定 到 视图 上 


CREATE TRIGGER trig 61 vw facts ins upd del 


INSTEAD OF INSERT OR UPDATE OR DELETE ON census.vw_ facts 


FOR EACH ROW EXECUTE PROCEDURE census.trig vw facts ins upd del(); 








可 以 看 到 ， 这 个 绑 定 过 程 所 使 用 的 语法 几乎 就 是 一 行 很 目 然 的 英文 
句子 ， 这 种 情况 在 SQL 领域 还 是 不 多 见 的 。 


人 
facts 家 : 





UPDATE census.vw facts SET yr = 2612 
WHERE yr = 2611 AND tract id = '25627761280'; 





执行 成 功 后 PostgreSQL 会 输出 以 下 信息 : 


Query returned successfully: 56 rows affected，46 ms execution time. 


如 采 试 图 更 新 的 字段 不 在 前 面 触 发 器 函数 中 所 列 的 可 更 新 字段 列表 
中 ， 那 么 更 新 操作 就 不 会 合 中 任何 记录 : 





UPDATE census.vw facts SET short name = 'test'; 


和 输出 消息 将 如 下 所 示 : 


Query returned successfully: 6 rows affected, 931 ms execution time. 


前 面 的 例子 中 我 们 用 一 个 触发 器 函数 处 理 了 所 有 类 型 的 触发 事件 
CINSERT 、UPDATE 、DELETE ) ， 但 实际 上 专门 为 每 种 触发 事件 
创建 一 个 独立 的 触发 器 也 是 可 以 的 。 


PostgreSQL 还 支持 一 种 名 为 rules 的 规则 机 制 来 更 新 视图 ， 该 机制 
的 出 现 早 于 INSTEAD OF 触发 喜 文 持 视图 这 一 功能 。 博 文 “<Database 
Abstraction with Updateable Views” 中 有 基于 rules 机 制 实现 可 更 新 视 
图 的 例子 。 


你 依然 可 以 使 用 rules 机 制 来 实现 视图 数据 的 更 新 ， 但 我 们 更 推荐 
使 用 INSTEAD OF 触发 器 机 制 。 从 内 部 实现 机 制 看 ，PostgreSQL 依 
然 使 用 了 rules 机 制 来 实现 视图 功能 (视图 本 质 上 就 是 一 个 
INSTEAD OF SELECT 规则 加 上 一 个 虚拟 表 ) 和 基于 单 表 的 可 更 新 
视图 功能 。rules 机 制 和 触发 器 机 制 的 区 别 在 于 : rules 机 制 通过 重 
写 原始 SQL 达成 目标 ; 触发 器 通过 拦截 每 行 操作 并 改变 其 实现 好 
辑 来 达成 目标 。 可 以 看 到 ， 当 一 个 操作 涉及 多 张 表 时 ，rules 系统 无 
论 是 编写 还 是 理解 起 来 都 比 触 发 器 困难 得 多 。rules 机 制 还 有 一 个 缺 
陷 ， 就 是 只 能 用 SQL 语言 编写 ， 其 他 过 程式 语言 都 不 支持 。 


7.1.3 ”物化 视图 


物化 视图 会 把 视图 可 见 范 围 内 的 数据 在 本 地 缓存 下 来 ， 然 后 就 可 以 
当成 一 张 本 地 表 来 使 用 。 首 次 创建 物化 视图 以 及 对 其 执行 REFRESH 
MATERIALIZED VIEW 刷新 操作 时 ， 都 会 触发 数据 缓存 动作 ， 只 不 
过 前 者 是 全 量 缓存 ， 后 者 是 增 量 刷新 。 请 注意 ， 物 化 视图 特性 是 从 
9.3 版 开始 支持 的 。 


物化 视图 最 典型 的 应 用 场景 是 用 于 加 速 时 效 性 要 求 不 局 的 长 时 复杂 
查询 ， 在 OLAP 在 线 分 析 与 处 理 ) 领域 ， 这 种 查询 经 常 出 现 。 


物化 视图 的 力 一 个 特点 束 是 支持 建立 索引 以 加 快 但 询 速 度 。 示 例 7- 
7 建立 了 示例 7-1 中 的 视图 的 物化 版 本 。 


示例 7-7 建立 物化 视图 























CREATE MATERIALIZED VIEW census.vw facts _2611 materialized AS 
SELECT fact type id, val, yr, tract id FROM census .facts WHERE yr = 26 





然后 对 物化 视图 建立 一 个 索引 ， 语 法 与 在 普通 表 上 建立 索引 完全 相 
同 ， 如 示例 7-8 所 示 。 


示例 7-8 ”在 物化 视图 上 建立 索引 


CREATE UNIQUE INDEX ix 
ON census.vw_facts_2611 materialized (tract id, fact type id, yr); 











当 物 化 视图 中 含 大 量 记 录 时 ， 为 了 加 快 对 它 的 访问 速度 ， 我 们 需要 





对 数据 进行 排序 。 要 实现 这 一 点 ， 最 简单 的 方法 就 是 在 创建 物化 视 
图 时 使 用 的 SELECT 语句 中 增加 ORDER BY 子 句 。 


男 外 一 种 方法 束 是 对 其 执行 聚 艇 排序 操作 ， 以 使 得 记录 的 物理 存储 
顺序 与 索引 的 顺序 相同 ， 有 具体 步骤 是 : 首先 创建 一 个 索引 ， 访 索引 
应 体现 你 所 希望 的 排序 ;然后 基于 指定 索引 对 物化 视图 执行 
CLUSTER 命令 ， 语 法 如 示例 7-9 所 示 。 


示例 7-9 ”基于 某 索 引 对 物化 视图 执行 聚 复 排序 操作 











CLUSTER census.vw facts 2611 materialized USING ix; © 
CLUSTER census.vw facts 2611_ materialized; © 





@ 指定 聚 筷 操作 所 依据 的 索引 名 。 执 行 过 以 后 ， 系 统 就 会 自动 记 
下 该 表征 依据 哪个 索引 进行 聚 徐 排 序 的， 后 面 再 次 执行 聚 徐 操 作 时 
系统 会 目 动 使 用 该 索引 ， 所 以 索引 名 仅 在 首次 聚 艇 操作 时 需要 ， 后 


续 不 再 需要 。 


人 














相对 于 CLUSTER 方案 来 说 ，ORDER BY 方案 的 优点 在 于 ， 每 次 执行 





REFRESH MATERIALIZED VIEW 时 都 会 自动 对 记录 进行 重 排序 ， 但 
CLUSTER 方案 束 必 须 手 动 执行 ， 其 缺点 在 于 物化 视图 加 了 ORDRE 
BY 以 后 ，REFRESH 操作 执行 会 耗 时 更 久 。 在 正式 使 用 ORDER BY 
方案 之 前 ， 你 应 该 对 REFRESH 操作 进行 测试 ， 看 其 性 能 是 否 可 接 
受 。 男 一 种 测试 方法 是 直接 运行 创建 物化 视图 时 所 用 的 带 ORDER 
BY 的 SQL 语句 。 


在 PostgreSQL 9.3 中 ， 刷 新 物化 视图 的 语法 如 下 : 


REFRESH MATERIALIZED VIEW census.vw facts _2011 materialized; 


在 PostgreSQL 9.4 中 ， 为 了 解决 物化 视图 刷新 操作 时 不 可 访问 的 问 
题 ， 可 以 使 用 以 下 语法 : 


REFRESH MATERIALIZED VIEW CONCURRENTLY census.vw facts 2611 materializ 


物化 视图 有 以 下 几 个 缺点 。 


。 不 支持 通过 CREATE OR REPLACE 语法 来 对 一 个 现 有 的 物化 视 
图 进行 重建 ， 要 想 重 建 只 能 先 删除 再 重建 ， 即 使 只 做 很 小 的 改 
变 也 需要 这 么 做 。 删 除 语法 是 DROP MATERIALIZED VIEW + 
视图 名 。 删 除 以 后 ， 该 视图 上 所 有 的 索引 都 会 丢失 。 

。 每 次 刷新 数据 时 都 要 执行 一 次 REFRESH MATERIALIZED VIEW 
操作 。PostgreSQL 不 支持 自动 刷新 物化 视图 。 要 想 实 现 自 动 刷 
新 ， 必 须 使 用 类 似 crontab 、pgAgent 定时 任务 或 者 是 触发 器 
之 类 的 机 制 。 博 文 “Caching Data-with Materialized Views and 
Statement-Level- Trigger” 中 提供 了 一 个 使 用 触发 器 来 进行 刷新 
的 例子 ， 可 供 你 参考 。 

。 在 9.3 版 中 ， 刷 新 物化 视图 是 一 个 阻塞 操作 ; 也 就 是 说 ， 视 图 
在 刷新 期 间 是 无 法 访问 的 。9.4 版 中 引入 了 一 个 新 的 
CONCURRENTLY 关键 字 ， 在 REFRESH 命令 中 增加 了 该 关键 字 以 
后 ， 可 以 解除 锁定 限制 ， 前 提 条 件 是 被 刷新 的 物化 视图 上 要 有 
一 个 唯一 索引 。 实 现 无 锁 刷 新 的 代价 就 是 ， 如 果 有 人 在 刷新 期 
间 进 行 视 图 访问 ， 那 么 刷新 时 间 会 变 长 。 

















01. 7.2 ”灵活 易 用 的 PostgreSQL 专 有 SQL 语法 


我 们 在 多 年 编写 SQL 语句 的 过 程 中 使 用 过 很 多 PostgreSQL 专 有 语 
法 ， 借 助 它们 可 以 编写 出 更 加 简洁 以 及 功能 更 加 强大 的 SQL。 本 市 
介绍 的 语法 都 是 PostgreSQL 的 专 有 语法 。“ 专 有 ”意味 着 该 语法 不 
符合 ANSI SQL 标准 。 如 果 你 的 老板 要 求 你 编写 的 SQL 必须 遵守 
ANSI SQL 标准 ， 那 么 请 不 要 使 用 本 节 介 绍 的 专 有 语法 。 














7.2.1 DISTINCT ON 


我 们 认为 最 好 用 的 一 个 专 有 语法 就 是 DISTINCT ON ， 其 功能 类 似 
于 DISTINCT ， 但 可 以 精确 到 更 细 的 粒度 。DISTINCT 会 将 结果 集 
中 完全 重复 的 记录 剔除 ， 但 DISTINCT ON 可 以 将 结果 集中 指定 字 
段 值 的 重复 记录 崭 除 ， 具 体 实 现 方 法 是 先 对 结果 集 按 照 DISTINCT 
ON 指定 的 字段 进行 排序 ， 然 后 第 选 出 每 个 字段 值 第 一 次 出 现时 所 
在 的 记录 ， 其 余 的 记录 都 剔除 。 可 以 看 到 ， 一 个 小 小 的 单词 ON 就 
实现 了 必须 写 大 量 代码 才能 实现 的 功能 。 


示例 7-10 中 省 示 了 如 何 获取 马 蔷 诸 蹇 州 每 个 县 的 第 一 个 人 口 统计 
区 的 信息 。 


示例 7-10 ”DISTINCT ON 的 用 法 











SELECT DISTINCT ON (left(tract id, 5)) 

left(tract id, 5) As county, tract id, tract name 
FROM census.lu tracts 
ORDER BY county, tract id; 


tract_ name 


256616161606 Census Tract 161, Barnstable County, Massachuse 
2566396610606 Census Tract 9661，Berkshire County, Massachuse 
2566566610606 Census Tract 6661，Bristol County, Massachusett 
2566726610606 Census Tract 2661，Dukes County, Massachusetts 
25009201166 Census Tract 2611，ESssex County，Massachusetts 


(14 rows) 








请 注意 ，ON 修饰 符 支 持 设 置 多 列 ， 运 算 时 将 基于 这 多 个 列 的 总 体 
唯一 性 来 进行 去 重 操 作 。 同 时 ， 查 询 语 句 中 ORDER BY 子 句 的 排序 
字段 列表 的 最 左 侧 必须 是 DISTINCT ON 指定 的 字段 列表 ， 即 保证 
整个 结果 集 是 按照 这 几 个 字段 排序 的 ， 这 样 最 终 去 重 后 得 到 的 结果 
才 是 你 想 要 的 。 











7.2.2 LIMIT 和 OFFSET 关键 字 


LIMIT 关键 字 指 定 了 查询 时 仅 返 回 指 定数 量 的 记录 ，0OFFSET 关键 
字 指 定 了 从 第 几 条 记录 开始 返回 。 你 可 以 将 二 者 结合 起 来 使 用 ， 也 
可 以 单独 使 用 。 一 般 来 说 ， 这 两 个 关键 字 总 是 和 ORDER BY 联 用 
的 ， 因 为 只 有 在 一 个 已 经 按照 用 户 的 意图 排 好 序 的 结果 集 上 指定 返 
回 特定 的 子 结果 集 才 有 意义 。 示 例 7-11 中 演示 了 OFFSET 关键 字 的 
用 法 ， 如 果 不 设 置 OFFSET 的 话 ， 其 值 默认 为 0。 


该 语法 并 非 PostgreSQL 所 特有 ， 事 实 上 它 最 早 源 自 于 MySQL。 这 
种 限制 返回 结果 记录 数 的 功能 在 很 多 数据 库 中 都 支持 ， 但 具体 语法 
和 内 部 实现 机 制 各 有 千秋 。 


示例 7-11 要求 示例 7-10 的 查询 结果 集 仅 返回 从 第 3 条 开始 
的 3 条 记录 








SELECT DISTINCT ON (left(tract id, 5)) 

left(tract id, 5) As county, tract id, tract name 
FROM census.lu tracts 
ORDER BY county, tract id LIMIT 3 OFFSET 2; 


county | tract id | tract name 
ee 二 +------------- 二 +------------------------------------------------ 


25665 | 25665666166 | Census Tract 6661，Bristol County, Massachusett 
25667 | 25667266166 | Census Tract 2661，Dukes County, Massachusetts 

25669 | 25669261166 | Census Tract 2611，Essex County, Massachusetts 

(3 rows) 





7.2.3 ”人 简化 的 类 型 转换 语法 


ANSI SQL 标准 中 定义 了 一 个 名 为 CAST 的 类 型 转换 函数 ， 可 以 实 
现 数据 类 型 之 间 的 互 转 。 例 如 CAST( '2611-1-1' AS date) 可 以 


将 文本 2611-1-1 转换 为 一 个 日 期 型 数据 。PostgreSQL 支持 一 种 简 
写 语 法 ， 该 语法 使 用 了 两 个 冒号 来 表示 转换 关系 ， 有 具体 格式 

为 : '2811-1-1' ::date 。 这 种 写法 形式 更 简洁 也 更 易于 使 用 ， 比 
如 有 时 候 需 要 级 联 执行 多 个 类 型 转换 动作 ， 也 就 是 说 需要 将 类 型 A 
转换 为 类 型 B 再 转换 为 类 型 C， 这 种 情况 用 简写 语法 也 是 可 以 实现 
的 ， 例 如 someXML: :text: :integer 。 


7.2.4 一 次 性 插入 多 条 记录 


PostgreSQL 文 持 一 次 性 插入 多 条 记录 的 语法 。 示 例 7-12 演示 了 如 
何 同 示例 6-3 中 创建 的 表 中 一 次 性 插入 多 条 记录 。 


示例 7-12 一 次 性 插入 多 条 记录 


INSERT INTO logs 2811 (user name, description, log ts) 
VALUES 
('robe', 'logged in', '2611-61-16 16:15 AM EST'), 


('lhsu', 'logged out', '26011-61-11 16:26 AM EST'); 





请 注意 ， 在 PostgreSQL 中 VALUES 子 句 并 不 是 只 能 作为 INSERT 语 
句 的 一 部 分 来 使 用 ， 它 其 实 是 一 个 动态 生成 的 临时 结果 集 ， 可 用 于 
多 种 场合 ， 如 示例 7-13 所 示 。 


示例 7-13 ”使 用 VALUES 语法 来 模拟 一 个 虚拟 表 


SELECT * 
FROM ( 
VALUES 
('robe', 'logged in', '26011-61-16 16:15 AM EST'::timestamptz), 


('lhsu', 'logged out', '26011-61-11 160:26 AM EST'::timestamptz) 
) AS 1 (user name, description, log ts); 








将 VALUES 子 句 当 作 一 个 虚拟 表 来 用 时 ， 需 要 为 该 表 指 定 字 段 名 ， 
并 对 那些 无 法 隐 式 转换 的 字段 值 显 式 地 进行 类 型 转换 。MySQL 和 
SQL Server 也 文 持 该 语法 。 


7.2.5 ”使 用 ILIKE 实现 不 区 分 大 小 写 的 查询 


PostgreSQL 是 一 套 区 分 大 小 写 的 系统 ， 但 它 也 可 以 实现 不 区 分 大 小 

写 的 文本 搜索 ， 实 现 方法 有 两 种 。 一 种 是 将 ANSI LIKE 运算 符 两 

边 的 文本 都 用 upper 函数 转 为 大 写 ， 但 这 样 会 导致 用 不 上 索引 ， 

或 者 必须 单独 建立 一 个 基于 upper 函数 的 函数 式 索 引 才 能 使 查询 

语句 用 上 索引 本 1 PostgreSQL 所 特有 的 ILIKE 运算 符 
(~~* ) ， 语 法 如 下 : 











SELECT tract name FROM census.lu tracts WHERE tract name ILIKE '%duke% 
tract _ name 


Census Tract 2061，Dukes Massachusetts 
Census Tract 20602，Dukes Massachusetts 


Census Tract 2663，Dukes County，Massachusetts 
Census Tract 2664，Dukes County，Massachusetts 
Census Tract 99686，Dukes County，Massachusetts 











7.2.6 ”使 用 ANY 运算 和 从 进行 数组 搜索 


PostgreSQL 有 一 个 专用 于 数组 数据 处 理 的 ANY 运算 符 ， 一 般 用 于 

单个 值 与 数组 元 素 值 的 匹配 比较 场景 ， 所 以 使 用 时 还 会 需要 有 一 个 
比较 运算 符 或 者 比较 关键 字 。ANY 运算 符 的 效果 是 ， 只 要 数组 中 的 
0 则 该 行 记录 就 被 查询 条 件 命 


队 下 是 二 人 例子 








SELECT tract name 
FROM census.lu tracts 
WHERE tract name ILIKE ANY(ARRAY['%99%duke%"','%66%Barnstable%" ] : :text[ 


tract_name 

Census Tract 162.66，Barnstable County, Massachusetts 
Census Tract 163.66，Barnstable County, Massachusetts 
Census Tract 166, Barnstable County，Massachusetts 
Census Tract 9966，Dukes County，Massachusetts 

(4 rows) 


可 以 把 这 个 例子 里 面 的 数组 元 系 全 部 拆 出 来 ， 每 个 写成 一 行 ILIKE 
比较 语句 并 用 OR 将 这 些 语句 连 起 来 ， 这 也 可 以 达到 与 上 例 同等 的 

效果 ， 但 显然 要 繁 珊 得 多 。 也 可 以 将 ANY 运算 符 与 LIKE 、=、~ 
(基于 正则 表达 式 的 Like 运算 ) 等 比较 运算 符 联 用 。 


ANY 运算 符 是 非常 通用 的 ， 它 可 以 针对 任何 数据 类 型 的 数组 使 用 ， 
可 以 与 任何 比较 运算 符 联 用 《所 谓 比 较 运 算 符 就 是 指 返回 结果 类 型 
为 布尔 型 的 运算 符 ) ， 甚 至 可 以 与 用 户 目 定义 的 或 者 是 安装 扩展 包 
得 到 的 新 数据 类 型 或 者 新 比较 运算 符 联 用 。 


7.2.7 可 以 返回 结果 集 的 函数 
所 谓 返 回 结果 集 的 函数 就 是 能 够 一 次 性 返回 多 行 记录 的 函数 。 


PostgreSQL 人 允许 在 SELECT 语句 中 调用 能 够 返回 多 行 记录 的 函数 。 
Re 一 般 仅 文 持 调用 返回 一 行 记 录 
A 阴沟 A 


在 一 个 复杂 的 SQL 语句 中 使 用 返回 结果 集 的 函数 很 容易 导致 意外 
的 结果 ， 这 是 因为 这 类 函数 输出 的 结果 集会 与 该 语句 其 他 部 分 生成 
的 结果 集 产生 稍 卡 儿 积 ， 从 而 生成 更 多 的 记录 行 。 因 此 在 使 用 之 
前 ， 你 必须 对 此 后 果 有 所 了 解 。 在 示例 7-14 中 ， 我 们 使 用 
generate_series 函数 演示 了 这 种 情况 。 先 建 表 如 下 : 
































CREATE TABLE interval periods (i type interval); 


INSERT INTO interval periods (i type) 
VALUES ('5 months'), ('132 days'), ('4862 hours'); 





示例 7-14 ”在 SELECT 语句 中 使 用 返回 结果 集 的 函数 


SELECT i type， 
generate_series('2012-61-61' ::date，2612-12-31'::date,i type) As d 


FROM interval periods; 





i type | dt 


OE 
| 2612-61-61 66:66:68-65 
5 months | 2612-66-61 866:66:66-64 


5 months 2012-11-61 60:660:00-04 
132 days 2012-01-61 60:660:060-05 
132 days 2012-05-12 60:6060:06-04 
132 days 2012-09-21 60:660:06-04 


4862 hours | 2612-61-61 66:66:66-65 
4862 hours | 2612-67-21 15:66:66-64 





7.2.8 ”限制 对 继承 表 的 DELETE 、UPDATE 、INSERT 操作 


的 影响 范围 


如 果 表 间 是 继承 关系 ， 那 么 查询 父 表 时 就 会 将 子 表 中 满足 条 件 的 记 
录 也 查 出 来 。DELETE 和 UPDATE 操作 也 遵循 类 似 逻 辑 ， 即 对 父 表 
的 修改 操作 也 会 影响 到 子 表 的 记录 。 有 时 你 可 能 希望 操作 仅 限 定 于 
主 表 范 围 之 内 ， 并 不 希望 子 表 受 到 波及 。 


PostgreSQL 提供 了 ONLY 关键 字 以 实现 此 功能 。 我 们 在 示例 7-37 中 
展示 了 ONLY 的 用 法 。 在 该 示例 中 ， 我 们 希望 仅 从 生产 表 中 删除 那 
些 尚未 迁移 到 日 志 表 中 的 记录 。 如 果 没 有 ONLY 修饰 符 ， 我 们 最 终 
将 从 子 表 中 删除 先前 可 能 已 移动 过 的 记录 。 





7.2.9 DELETE USING 语法 


我 们 经 常会 遇 到 “只 有 当 记 录 的 字段 值 落 在 另外 一 个 结果 集中 时 ， 

才 需 要 删除 该 记录 ”的 情况 ， 那 么 此 时 就 必须 借助 一 次 关联 查询 才 
能 定位 到 要 删除 的 目标 记录 。 此 时 可 以 使 用 USING 子 句 来 指定 需 
关联 的 表 ， 然 后 在 WHERE 子 句 中 编写 USING 子 句 的 表 和 FROM 子 句 
的 表 之 间 的 关联 语句 ， 来 确定 哪些 记录 需 删 除 。USING 子 句 中 可 以 
间 定 多 张 表 ， 中 间 用 逗号 分 隔 。 在 示例 7-15 中 ， 我 们 借助 一 个 关 
联 查 询 实 现 了 删除 census .facts 表 中 符合 short_name='s81' 
这 个 条 件 的 记录 。 


示例 7-15 ”DELETE USING 的 用 法 


DELETE FROM census .facts 
USING census .lu _ fact types As ft 











WHERE facts.fact type id = ft.fact type id AND ft.short name = 's01' 





如 条 不 使 用 该 语法 ， 一 般 的 做 法 是 在 WHERE 子 句 中 使 用 尝 拙 的 IN 


7.2.10 ”将 修改 影响 到 的 记录 行 返回 给 用 户 


RETURNING 是 ANSI SQL 规定 的 标准 语法 ， 但 文 持 该 语法 的 数据 库 
却 不 多 。 在 示例 7-37 中 ， 我 们 通过 RETURNING 子 句 将 在 DELETE 
操作 中 被 删除 的 记录 返回 给 了 用 户 。 当 然 ，INSERT 和 UPDATE 操 
作 也 是 可 以 使 用 RETURNING 的 。 对 于 带 serial 类 型 字段 的 表 来 
说 ，RETURNING 语法 是 很 有 用 的 ， 因 为 问 这 类 表 中 插入 记录 

时 ，serial 字段 是 临时 生成 而 非 用 户 指 定 的 ， 也 就 是 说 在 插入 动 
作 完 成 之 前 ， 用 户 也 不 知道 serial 字段 的 值 会 是 多 少 ， 除 非 是 再 
查询 一 裔 。 而 RETURNING 语法 使 得 用 户 不 用 再 次 查询 就 立即 得 到 
了 serial 字段 的 值 。 最 常见 的 用 法 一 般 是 RETURNING * ， 即 返 
回 所 有 字段 的 值 ， 但 也 可 以 指定 仪 返回 特定 字段 ， 如 示例 7-16 所 
加 \o 

















示例 7-16 ”在 UPDATE 语句 中 使 用 RETURNING 子 句 返回 修改 
过 的 记录 


UPDATE census.lu fact types AS f 

SET short name = replace(replace(lower(f.fact subcats[4])," '," '),":' 
WHERE f.fact subcats[3] = 'Hispanic or Latino:' AND f.fact subcats[4] 
RETURNING fact type_ id, short_ name; 


fact type_id short_name 


white alone 


black_or african american alone 

american_ indian and alaska native alone 

asian alone 

native hawaiian and other pacific islander alone 
some_other race alone 

two_or_more_races 





7.2.11 UPSERT : INSERT 时 如 果 主 键 冲突 则 进行 UPDATE 


PostgreSQL 9.5 中 引入 了 新 的 INSERT ON CONFLICT 语法 ， 业 界 一 
般 也 会 将 该 功能 称 为 UPSERT 。 当 无 法 确定 即将 插入 的 记录 是 否 会 
与 表 中 现 有 的 记录 冲突 时 ， 就 可 以 使 用 UPSERT 语法 来 确保 不 管 是 
人 否 有 冲突 都 不 会 报错 ， 该 语法 允许 用 户 自 定义 发 生 冲 突 时 的 行为 ， 
要 么 更 新 现 有 记录 ， 要 么 直接 忽略 。 


使 用 该 特性 时 ， 表 上 一 定 要 有 一 个 唯一 性 约束 。 这 个 约束 可 以 是 唯 
一 性 字段 、 主 键 、 唯 一 索引 或 者 排他 性 约束 。 一 旦 违反 该 约束 ， 用 
户 可 以 决定 后 续 如 何 处 理 : 用 新 记录 和 窗 盖 现 有 记录 ， 或 者 什么 也 不 
做 。 我 们 通过 一 个 例子 来 演示 其 用 法 ， 假 设 我 们 有 张磊 色 表 : 














CREATE TABLE colors(color varchar(56) PRIMARY KEY, hex varchar(6)); 


INSERT INTO colors(color, hex) 
VALUES('blue' ，'6666FF')，('red'，'FF6668 1) |; 








上 面 刚刚 插入 了 一 条 记录 ， 接 下 来 继续 插入 一 些 可 能 会 与 表 中 己 有 
记录 的 主键 重复 的 记录 到 该 表 中 。 正 常情 况 下 ， 插 入 主键 重复 的 记 
录 时 会 报 主键 冲突 错误 。 在 示例 7-17 中 ， 通 过 使 用 UPSERT 我 们 实 
现 了 对 主键 冲突 错误 的 忽略 ， 最 后 的 结果 是 只 有 表 中 原来 不 存在 的 
green 记录 被 插入 成 功 。 如 果 后 续 再 次 执行 该 SQL， 由 于 所 有 主键 
都 已 存在 ， 最 终 效果 是 不 会 往 表 中 插入 任何 新 记录 。 


示例 7-17 发 生 主键 冲突 时 忽略 冲突 记录 

















INSERT INTO colors(color, hex) 
VALUES('blue', '6666FF')，('red'，'FF6666')，('green'，'66FF66') 


ON CONFLICT DO NOTHING ; 











上 述 语句 的 保护 力度 还 不 够 。 如 果 有 人 插入 了 一 条 首 字 母 大 写 
的 “Blue” 的 记录 ， 由 于 与 现 有 的 “blue” 并 没有 主键 冲突 ， 因 此 会 插 
入 成 功 ， 那 么 系统 中 实际 上 会 出 现 两 条 同样 表达 “ 蓝 色 ”的 记录 ， 这 
是 我 们 不 希望 见 到 的 。 此 时 可 以 通过 创建 一 个 唯一 索引 来 解决 ， 语 
法 如 下 所 示 。 


CREATE UNIQUE INDEX uidx colors lcolor ON colors USING btree(lower(col 


此 时 再 次 插入 “Blue” 记 录 则 会 被 唯一 索引 阻止 ， 而 且 由 于 我 们 定义 
了 ON CONFLICT DO NOTHING ， 也 就 是 冲突 时 什么 都 不 干 ， 所 以 
效果 相当 于 什么 都 没 发 生 。 但 如 果 我 们 真 的 希望 用 "Blue” 来 取代 表 
中 已 有 的 “blue”， 则 可 以 使 用 示例 7-18 的 写法 。 


示例 7-18 ON CONFLIECT DO _ UPDATE 用 法 之 一 


INSERT INTO colors(color, hex) 
VALUES('Blue', '60066FF'), ('Red', 'FF6660'), ('Green', '66FF80') 
ON CONFLICT(lower(color)) 


DO UPDATE SET color = EXCLUDED.color, hex = EXCLUDED.hex; 





在 示例 7-18 中 我 们 设 定 了 ON CONFLICT 子 句 后 跟 的 唯一 性 字段 为 
lower(color) ， 该 字段 上 需要 定义 有 唯一 约束 或 者 唯一 索引 ， 
此 如 果 把 目标 字段 设 定 为 upper(color) 是 没有 意义 的 ， 因 为 
colors 表 上 没有 基于 uppser(color) 的 唯一 索引 。 


当 使 用 ON CONFLICT DO _ UPDATE 这 种 搭配 时 ，ON CONFLICT 后 
需要 跟 唯一 性 字段 或 者 唯一 约束 名 。 如 果 后 跟 唯一 性 约束 ， 则 需要 
使 用 ON CONFLICT ON CONSTRAINT + 约束 名 的 语法 ， 如 示例 7- 
19 所 示 。 


示例 7-19 ON CONFLICT DO _ UPDATE 用 法 之 二 


INSERT INTO colors(color, hex) 
VALUES('Blue'，'6666FF')，('Red'，'FF6668')，('Green'，'68FF66 
ON CONFLICT ON CONSTRAINT colors_pKkey 


DO UPDATE SET color = EXCLUDED.color，hex = EXCLUDED.hex; 





只 有 当 违 反 主 键 约束 、 唯 一 索引 或 者 唯一 键 值 约束 时 ，DO 子 句 才 
会 被 触发 ， 整 体 语句 不 会 报错 。 但 如 果 发 生 了 数据 类 型 错误 或 是 违 
有 反 检 查 约 束 等 别 的 错误 ， 整 体 语句 还 是 会 报错 ，DO UPDATE 子 句 不 


会 被 触及 。 
7.2.12 ”在 查询 中 使 用 复合 数据 类 型 


PostgreSQL 会 在 创建 表 时 自动 创建 一 个 结构 与 表 完全 相同 的 数据 类 
型 ， 其 中 包含 了 多 个 其 他 数据 类 型 的 成 员 字段 ， 因 此 也 会 被 称 为 复 
合 数据 类 型 。 你 第 一 次 见 到 基于 复合 数据 类 型 的 查询 语句 时 ， 可 能 
会 感到 很 惊讶 。 事 实 上 ， 你 可 能 已 经 在 编写 调试 SQL 语句 的 过 程 
中 见识 过 它 的 神奇 之 处 。 先 看 一 下 这 个 语句 ， 


SELECT x FROM census .lu _ fact _ types As x LIMIT 2; 


第 一 眼看 到 这 个 语句 时 ， 你 可 能 认为 我 们 漏 写 了 一 个 .* ， 但 请 看 
一 下 该 语句 的 执行 结果 : 














(86,Population,"{D881,Total:}" ,de61) 


(87,Population,"{D882,Total:,""Not Hispanic or Latino:""}",de062) 





语句 不 但 没有 报错 ， 而 且 返 回 的 结果 是 标准 的 lu_fact_type 类 
型 。 我 们 看 一 下 第 一 行 记录 的 内 容 来 确认 有 没有 问题 ，86 是 
fact_type_id 字段 的 值 ，Population 是 category 字段 的 

值 ，{D881,Total:} 是 fact_subcats 属性 。 可 以 看 到 ， 字 上段 值 
与 表 定 义 完 全 匹配 ， 没 有 问题 。 复 合 数据 类 型 可 以 作为 多 个 很 有 用 
的 函数 的 输入 ， 比 如 array_agg 和 hstore (hstore 扩展 包 提 供 
的 一 个 图 级 ， 可 以 将 一 行 记 录 转 换 为 hstore 的 一 个 键 值 对 象 ) 


如 果 你 正在 开发 Web 应 用 ， 那 么 建议 你 充分 利用 PostgreSQL 原生 
文 持 的 JSON 和 JSONB 数据 类 型 的 强大 能 力 。 关 于 JSON 和 
JSONB 的 详情 ， 请 参见 5.6 节 。 通 过 联 用 array_agg 和 
array_to_json 这 两 个 函数 ， 可 以 将 语句 的 查询 结果 转换 为 一 个 
JSON 对 象 后 输出 ， 如 示例 7-20 所 示 。 





示例 7-20 ”将 查询 结果 转换 为 JSON 格式 


SELECT array to json(array agg(f)) As cat © 
FROM ( 


SELECT MAX(fact type id) As max_type, category @ 


FROM census.1lu fact types 
GROUP BY category 
) As ff; 





输出 结果 如 下 : 


[{"max_type":1062,"category":"Population"}, 


{"max_type":153,"category":"Housing"}] 





@@ 定义 一 个 名 为 于 的 子 查 询 ， 可 以 从 中 查 出 记录 。 


名 使 用 array _agg ee 回 的 结果 集聚 合 为 一 个 数组 ， 
然后 将 这 个 结果 集 数 组 通过 array_to_json 转变 为 一 个 JSON 字 
段 。 


PostgreSQL 9.3 版 提供 了 一 个 名 为 json_agg 的 函数 ， 该 函数 的 效 
果 相 当 于 上 面 示例 中 array_ to_json 和 array_agg 联 用 的 效果 ， 

但 执行 速度 更 快 ， 使 用 起 来 也 更 方便 。 在 示例 7-21 中 ， 我 们 使 用 
json_agg 改写 了 示例 7-20 中 的 语句 ， 二 者 的 输出 是 相同 的 。 


示例 7-21 使 用 json_agg 将 查询 结果 转 为 JSON 格式 


SELECT json agg(f) As cats 

FROM ( 
SELECT MAX(fact_type_id) As max type，category 
FROM census.1lu_ fact types 


GROUP BY category 
) As 二; 





7.2.13 ”使 用 $ 文 本 引用 符 


在 ANSI SQL 标准 中 ， 字 符 串 的 引用 符 是 单 引 号 《' ) 。 但 如 果 字 
符 串 内 容 本 映 就 含有 单 引 号 则 会 过 到 麻烦 ， 因 为 系统 不 知道 字符 串 
到 底 在 哪里 截止 ， 此 时 就 需要 用 转 义 符 来 对 文本 中 的 单 引 号 进行 转 
义 。 文 本 中 含 单 引 号 的 情况 还 是 比较 普遍 的 ， 比 如 名 字 O'Nan， 再 
比如 从 属 关 系 表达 mon's place， 又 比如 缩写 cant。 我 们 需要 采用 在 
前 面 另 加 一 个 单 引 号 的 方式 ， 对 单 引 号 进行 转 义 。 也 束 是 说 ， 字 符 
串 内 容 中 看 起 来 是 两 个 单 引 号 连 写 ， 但 其 实 表 达 的 是 “单个 单 引 

号 ”这 一 内 容 。 比 如 你 需要 编写 一 个 INSERT 语句 ， 其 中 某 个 字段 
的 内 容 是 从 一 部 小 说 中 复制 出 来 的 大 段 文 字 ， 其 中 难免 会 有 单 引 
号 。 如 果 在 这 大 段 文 字 中 的 每 个 单 引 号 之 前 都 附加 一 个 单 引 号 来 进 
行 转 义 ， 这 项 工作 会 很 党 琐 ， 而 且 文 本 读 起 来 会 让 人 很 痛 兰 ， 因 为 
两 个 单 引 号 看 起 来 很 像 是 一 个 双 引 号 ， 但 二 者 又 根本 不 是 一 回 事 。 


为 了 解决 这 个 问题 ，PostgreSQL 文 持 使 用 $$ 来 将 任意 长 度 的 文本 
包 起 来 ， 这 样 就 可 以 不 用 对 文本 中 的 单 引 号 做 转 义 处 理 。 


$ 引用 符 还 可 用 于 执行 动态 SQL 的 场景 ， 例 如 exec( 某 sql) 。 在 
示例 7-5 中 ， 我 们 就 使 用 了 $$ 将 触发 器 的 定义 字符 串 包 起 来 。 

如 果 需 要 用 一 个 SQL 来 将 两 个 字符 串 拼 接 起 来 ， 而 这 两 个 字符 串 
中 又 含有 很 多 单 引 号 ， 那 么 符合 ANSI 标准 的 写法 是 这 样 的 : 



































SELECT 'It''s O0''Neil''s play. ' || "It''11 start at two o''clock.' 





使 用 $$ 引用 符 看 起 来 是 这 样 的 : 


SELECT $$It's O'Neil's play. $$ || $$It'11 start at two o'clock.$$ 


这 显然 简化 了 很 多 ， 也 更 加 清晰 易 懂 了 。 


前 后 的 $5$ 符 取 代 了 原本 的 单 引 号 文本 引用 符 ， 并 对 其 中 所 有 的 单 
引号 实现 了 转 义 。 


该 用 法 还 有 一 个 变种 ， 我 们 称 之 为 命名 $ 引用 符 ， 后 续 内 容 中 会 对 
其 进行 介绍 。 


7.2.14 DO 


DO 命令 可 以 执行 一 个 基于 过 程式 语言 的 匿名 代码 段 ， 可 以 将 其 看 
作 一 个 一 次 性 使 用 的 匿名 函数 。 在 下 面 的 示例 中 ， 我 们 将 演示 如 何 
通过 执行 一 个 匿名 代码 段 来 将 示例 3-10 中 插入 的 数据 从 中 间 表 加 
载 到 产品 表 中 。 示 例 中 的 匿名 代码 段 是 用 PL/pgSQL 编写 的 ， 但 你 
也 可 以 使 用 别 的 语言 编写 。 


首先 执行 建 表 操 作 : 


set search path=census; 
DROP TABLE IF EXISTS lu fact types CASCADE; 
CREATE TABLE lu fact types ( 

fact type_id serial, 

category varchar(166)， 


fact subcats varchar(255)[]， 
short name varchar(56)， 
CONSTRAINT pk_lu fact types PRIMARY KEY (fact type_id) 





然后 使 用 D0 语法 来 对 其 生成 一 些 记 录 ， 如 示例 7-22 所 示 。 上 面 的 
CASCADE 关键 字 的 效果 是 将 该 表 所 有 的 关联 对 象 一 次 性 删除 ， 比 如 
外 键 约 束 、 视 图 等 。 因 此 ， 使 用 CASCADE 关键 字 时 要 特别 小 心 。 


示例 7-22 中 生成 了 一 系列 的 INSERT INTO SELECT 语句 ， 然 后 通 
过 这 些 语句 实现 数据 迁移 。 这 些 SQL 还 实现 了 由 列 转 行 的 转换 操 
1 














外 示例 7-22 中 仅 包含 了 为 lu fact _types 表 生 成 数据 的 
部 分 代码 。 请 从 本 书 附加 的 代码 和 数据 资源 包 中 找到 
building_census_tables.sql 这 个 脚本 ， 其 中 有 完整 的 建 
表 语 句 。 


示例 7-22 ”使 用 D0 命令 来 生成 动态 SQL 


DO language plpgsql 

$$ 

DECLARE var sql text; 

BEGIN 

var_sql := string agg( 

$sqls © 
INSERT INTO lu fact types(category, fact subcats, short name) 
SELECT 


'Housing', 
array_agg(s$sql$ || lpad(i::text,2,'0') 


|| ') As fact subcats,' 
|| quote literal('s' || lpad(i::text,2,'06')) || ' As sho 
FROM staging.factfinder import 
WHERE s' || lpad(I::text,2,'0') || $sql$ ~ '^[a-zA-Z]+' $sql$, 
) 
FROM generate series(1,51) As I; @ 
EXECUTE var sql; © 
END 
$$; 





@ 这 里 使 用 了 $ 引用 符 ， 因 此 不 需要 为 后 面 的 Housing 前 后 的 单 引 
号 进行 转 义 。 因 为 DO 之 后 的 命令 是 用 $$ 引用 符 封 装 起 来 的 ， 所 以 
这 里 需要 使 用 命名 的 $ 引用 符 而 不 能 使 用 $$ 。 我 们 选择 的 是 
$sql$ 这 个 命名 引用 符 。 


四 使 用 string_agg 函数 让 一 组 SQL 语句 形成 单一 字符 串 的 形式 
INSERT INTO lu fact type(...) SELECT ... WHERE s61 ~ 
'[a-zA-Z]+';。 


@ 执行 该 SQL。 


在 示例 7-22 中 ， 使 用 了 7.2.13 节 中 介绍 过 的 $ 引用 符 ， 来 将 DO 之 
后 的 函数 体 及 函数 体内 部 的 一 些 SQL 语句 包 里 了 起 来 。 由 于 同时 
使 用 了 内 外 两 级 $ 引 用 符 ， 所 以 如 果 对 这 两 级 引用 都 使 用 默认 的 
$$ 引用 符 ， 会 造成 系统 无 法 分 清 每 一 级 引用 符 的 边界 在 哪里 。 此 
时 我 们 可 以 对 内 外 两 级 $ 引用 符 中 的 至 少 一 级 命名 (也 就 是 所 请 
的 “命名 $ 引用 符 ”) 以 示 区 分 ， 当 然 ， 把 内 外 两 级 都 改 为 命名 引用 
符 也 是 可 以 的 。 


7.2.15 “适用 于 聚合 操作 的 FILTER 子 句 


9.4 版 中 新 引入 了 用 于 聚合 操作 的 FILTER 子 句 ， 这 是 近期 ANSI 
SQL 标准 中 新 加 入 的 一 个 关键 字 。 该 关键 字 用 于 替代 同 为 ANSI 
SQL 标准 语法 的 CASE WHEN 子 句 ， 使 聚合 操作 的 语法 得 以 简化 。 
例如 ， 假 设 你 需要 使 用 CASE WHEN 子 句 来 统计 每 个 学 生 不 同 科目 
的 多 次 测试 的 平均 成 绩 ， 语 法 如 示例 7-23 所 示 。 


示例 7-23 在 AVG 聚合 函数 中 使 用 CASE WHEN 


SELECT student， 
AVG(CASE WHEN subject ="'algebra' THEN score ELSE NULL END) As alge 
AVG(CASE WHEN subject ="'physics' THEN score ELSE NULL END) As phys 


FROM test_ scores 
GROUP BY student; 





用 FILTER 子 句 可 以 实现 与 上 面 语句 等 价 的 效果 ， 语 法 如 的 示例 7- 
24 所 示 。 


示例 7-24 ”AVG 聚合 函数 与 FILTER 子 句 的 配合 使 用 


SELECT student， 
AVG(score) FILTER (WHERE subject ='algebra') As algebra， 
AVG(score) FILTER (WHERE subject ='physics') As physics 


FROM test_scores 
GROUP BY student; 








对 于 求 平 均值 、 求 合计 值 以 及 其 他 很 多 聚合 函数 来 说 ，CASE 和 
FILTER 子 句 是 等 价 的 ， 即 二 者 可 以 起 到 相同 的 作用 。FILTER 子 句 
的 优势 在 于 写法 比较 清晰 简洁 ， 并 且 操 作 大 数据 量 时 速度 比较 
快 。CASE 语句 对 于 筛选 反 的 字段 值 是 当成 NULL 处 理 的 ， 因 此 对 于 
array_agg 这 种 会 处 理 NULL 值 的 聚合 函数 来 说 ， 使 用 CASE WHEN 
子 句 就 不 止 是 写法 繁琐 的 问题 了 ， 还 会 导致 输出 不 想 要 的 结果 。 在 
示例 7-25 中 ， 我 们 使 用 CASE. . .NHEN . . . 方法 查询 每 个 学 生 的 各 
门 课程 的 多 次 测试 成 绩 的 列表 来 演示 这 个 问题 。 











示例 7-25 CASE NHEN 子 句 与 array_agg 子 数 配合 使 用 


SELECT student, 
array_agg(CASE WHEN subject ='algebra' THEN score ELSE NULL END) A 
array_agg(CASE WHEN subject ='physics' THEN score ELSE NULL END) A 
FROM test_ scores 
GROUP BY student; 


student | algebra 


| {74,NULL,NULL, NULL,74,.. {NULL ,83, NULL, NULL, NULL ,79,..} 

| {75,NULL,NULL, NULL,78,.. {NULL ,72,NULL, NULL, NULL, 72..} 

| {68,NULL,NULL, NULL,77,.. {NULL ,83, NULL ,NULL, NULL, 85,..} 

| {84,NULL,NULL,NULL,80,.. {NULL ,72,NULL ,NULL, NULL ,72,..} 
(4 rows) 








可 以 看 到 示例 7-25 输出 的 成 绩 列表 中 含有 很 多 的 NULL 值 。 这 个 问 
题 可 以 通过 使 用 子 查 询 来 解决 ， 但 比 起 使 用 FILTER 来 说 还 是 麻烦 
又 低 效 。 示 例 7-26 中 演示 了 使 用 FILTER 时 的 写法 。 


示例 7-26 。 FILTER 子 句 与 array_agg 函数 的 配合 使 用 


SELECT student， 
array_agg(score) FILTER (WHERE subject ='algebra') As algebra， 
array_agg(score) FILTER (WHERE subject ='physics') As physics 
FROM test_ scores 
GROUP BY student; 


student | algebra | physics 


+--------- +-------- 


| {74,74} | {83,79} 
| {75,78} | {72,72} 
| {68,77} | {83,85} 
| {84,86} | {72,72} 





FILTER 子 句 适 用 于 所 有 聚合 函数 ， 不 仅仅 是 PostgreSQL 中 内 置 的 
那些 聚合 函数 ， 通 过 安装 扩展 包 支 持 的 聚合 函数 也 是 可 以 用 的 。 


7.2.16 ”查询 百 分 位 数 与 最 高 出 现 频率 数 











PostgreSQL 9.4 中 开始 文 持 用 于 计算 百 分 位 数 、 中 位 数 〈 等 同 于 0.5 
百 分 位 数 ) 和 最 高 出 现 频率 数 的 统计 函数 ， 有 具体 包括 
percentile_disc (用 于 计算 离散 白 分 位 ) 、percentile_cont 
(用 于 计算 连续 百 分 位 〉 以 及 mode 这 三 个 函数 。 


percentile disc 和 percentile_cont 的 区 别 在 于 二 者 处 理 同 

一 百 分 位 命中 多 条 记录 的 方法 。 前 者 会 取 该 百 分 位 范围 内 的 第 一 条 
命中 记录 的 值 ， 因 此 记录 顺序 会 对 最 终 返 回 哪 条 记录 产生 影响 ， 后 
者 会 把 百 分 位 范围 内 命中 的 所 有 记录 取 均 值 后 返回 。 

中 位 数 就 是 百 分 位 值 等 于 0.5 的 百 分 位 数 ， 因 此 计算 中 位 数 不 需 要 
一 个 专门 的 函数 。mode 函数 的 作用 是 取 分 组 中 出 现 频率 最 高 的 


值 ， 如 有 果 最 高 频率 的 值 有 多 个 ， 则 取 排 序 后 的 第 一 个 ， 因 此 排序 方 
法 会 对 mode 计算 的 结 末 有 影响 ， 如 示例 7-27 所 示 。 


示例 7-27 ”计算 中 位 数 和 出 现 频率 最 高 的 成 绩 








SELECT 
Student， 
percentile_cont(6.5) WITHIN GROUP (ORDER BY score) As cont median, 
percentile disc(6.5) WITHIN GROUP (ORDER BY score) AS disc median, 
mode() WITHIN GROUP (ORDER BY score) AS mode, 
COUNT(*) As num_ scores 

FROM test_ scores 

GROUP BY student 

ORDER BY student; 


student | cont median | disc median 


(4 rows) 








示例 7-27 同时 以 离散 模式 和 连续 模式 计算 了 学 生成 绩 的 中 位 数 ， 
当 出 现 同 分 的 学 生 时 ， 计 算 结果 可 能 是 不 一 样 的 。 


一 般 的 聚合 函数 是 二 接 把 要 进行 聚合 运算 的 目标 字段 作为 入 参 ， 但 
前 面 介绍 的 这 儿 个 函数 不 同 ， 它 们 的 直接 入 参 古 百 分 位 数 或 者 为 














空 ， 目 标 聚 合 字段 是 通过 后 面 的 WITHIN GROUP 子 句 中 的 ORDER 
BY 修饰 符 来 指定 的 。 

前 述 两 个 中 位 数 计算 函数 还 有 一 种 用 法 ， 即 可 以 输入 多 个 数字 作为 
百 分 位 数 ， 从 而 实现 一 次 查询 返回 匹配 多 个 百 分 位 数 的 多 个 目标 记 
录 。 示 例 7-28 通过 单条 SQL 语句 实现 了 一 次 性 获取 中 位 数 记 录 、 
60% 分 位 数 记 录 以 及 最 高 分 记录 。 


示例 7-28 ”一 次 性 计算 多 个 百 分 位 数 





SELECT 
Student， 
percentile cont('{08.5,60.60,1}'::float[]) 
WITHIN GROUP (ORDER BY score) AS cont median, 
percentile disc('{08.5,60.60,1}'::float[]) 
WITHIN GROUP (ORDER BY score) AS disc median, 
COUNT(*) As num scores 
FROM test_ scores 
GROUP BY student 
ORDER BY student; 


student | cont median | disc median 
ee RA OE DY OO 
| {78,79.2,84} | {77,79,84} 
| {72,73.6,84} | {72,72,84} 
regina | {76,76.8,906} | {76,77,906} 
sonia | {73.5,75.6,86} | {72,75,86} 
(4 rows) 





如 同 其 他 聚合 函数 一 样 ， 你 可 以 将 这 几 个 函数 与 肾 合 函数 中 一 些 通 
用 的 修饰 符 联 用 。 示 例 7-29 演示 了 如何 将 WITHIN GROUP 与 
FILTER 联 用 。 


示例 7-29 ”计算 两 个 科目 的 成 绩 中 位 数 





SELECT 


student, 

percentile disc(6.5) WITHIN GROUP (ORDER BY score) 
FILTER (WHERE subject = 'algebra') As algebra, 

percentile disc(6.5) WITHIN GROUP (ORDER BY score) 
FILTER (WHERE subject = 'physics') AS physics 


FROM test_scores 
GROUP BY student 
ORDER BY student ; 


student | algebra | physics 
pe et 
alex | 74 | 79 
leo | 86 | 72 
regina | 68 | 83 
sonia | 75 | 72 


(4 rows) 





01. 7.3 窗口 函数 


窗口 函数 是 ANSI SQL 标准 中 规定 的 一 个 通用 特性 。 通 过 使 用 窗口 
函数 ， 可 以 在 当前 记录 行 中 访问 到 与 其 存在 特定 关系 的 其 他 记录 
行 ， 相 当 于 在 每 行 记 录 上 都 开 了 一 个 访问 外 部 数据 的 窗口 ， 这 也 
是 “窗口 函数 ”这 个 名 称 的 由 来 。“ 窗 口 * 就 是 当前 行 可 见 的 外 部 记录 
行 的 范围 。 通 过 窗口 函数 可 以 把 当前 行 的 “窗口 ?区 域内 的 记录 的 聚 
合 运算 结果 附加 到 当前 记录 行 。row_number 和 rank 这 类 窗口 函 
数 能 够 基于 窗口 区 的 数据 实现 对 记录 行 的 复杂 排序 。 


如 果 不 借 助 窗口 函数 而 又 想 要 达到 相同 的 效果 ， 束 只 能 使 用 关联 操 
作 和 子 查 询 。 表 面 上 看 ， 使 用 窗口 函数 违背 了 SQL 语言 “基于 结果 
集 ” 的 编程 思想 ， 因 为 它 为 每 一 行 数 据 拓展 出 了 一 个 外 部 数据 域 。 
但 从 另外 一 个 角度 看 ， 我 们 可 以 认为 窗口 函数 本 质 上 仪 是 一 种 用 来 
蔡 代 关联 操作 和 子 查 询 的 简写 语法 ， 也 就 是 说 窗口 函数 并 未 突破 
SQL 体系 原 有 的 运算 逻辑 ， 那 么 也 就 不 算 违 反 了 “基于 结果 集 ” 的 思 
想 。 你 可 以 从 PostgreSQL 官方 手册 的 “窗口 函数 "一 节 中 看 到 更 多 
说 明和 示例 。 


示例 7-30 可 帮助 你 理解 窗口 函数 的 基本 概念 。 通 过 使 用 窗口 函 
数 ， 可 以 在 单个 SELECT 语句 中 同时 获取 到 符合 
fact_type_id=86 条 件 的 记录 的 均值 计算 结果 ， 以 及 原始 记录 的 
详细 信息 。 请 注意 ， 语 句 执 行 时 总 是 先 涌 选 WHERE 条 件 再 计算 窗 
口 函数 ， 因 为 这 样 显然 可 以 避免 做 无 用 功 。 


示例 7-30 ”基本 的 窗口 函数 















































SELECT tract id, val, AVG(val) OVER () as val avg 
FROM census.facts 
WHERE fact type id = 86; 


tract id | val | val_avg 

a Er I 
250016010160 | 2942 .000 | 4430 .0602165087956698 
2500160102606 | 2750.060 | 4430 .0602165087956698 
250016010208 | 2003 .0600 | 4430 .0602165087956698 
250016010304 | 2421.060 | 4430 .0602165087956698 


OVER 子 名 限定 了 窗口 中 的 可 见 记录 范围 。 本 例 中 的 OVER 子 句 未 设 
定 任何 条 件 ， 因 此 从 该 窗口 中 能 看 见 全 表 的 所 有 记录 ， 所 以 
AVERAGE 运算 的 结果 就 是 表 中 所 有 符合 fact_type_id=86 条 件 的 
记录 中 val 字段 的 平均 值 。 你 可 以 看 到 ， 通 过 为 其 增加 OVER 子 
句 ， 我 们 把 一 个 传统 的 AVG 聚合 运算 函数 转变 成 了 一 个 窗口 函 
数 。PostgreSQL 在 遍历 每 一 行 记录 时 都 会 基于 全 表 记 录 进 行 一 次 
AVG 运算 ， 然 后 将 得 到 的 均值 作为 当前 行 的 一 个 字段 输出 。 由 于 
窗口 数据 域内 包含 多 条 记录 ， 这 意味 着 窗口 函数 运算 的 结果 一 定 在 
多 条 记录 上 都 是 重复 的 。 事 实 上 ， 窗 口 函数 实现 了 无 须 GROUP BY 
的 聚合 运算 ， 还 实现 了 无 须 JOIN 的 关联 操作 ， 从 而 将 窗口 函数 的 
运算 结果 回填 到 记录 行 中 。 


所 有 SQL 聚合 函数 都 可 以 通过 增加 OVER 子 句 的 方式 来 当 作 窗 口 函 
数 使 用 。 除 了 这 些 双重 身份 的 函数 之 外 ， 系 统 中 还 有 RON 、RANK 
、LEAD 等 专门 的 窗口 函数 ， 你 可 以 从 PostgreSQL 官方 手册 的 “ 窗 
口 函 数 ” 一 节 中 看 到 完整 的 窗口 函数 列表 。 



































7.3.1 PARTITION BY 子 句 


窗口 函数 的 窗口 可 见 记录 范围 是 可 设置 的 ， 可 以 是 全 表 记 录 ， 也 可 
以 是 与 当前 行 有 关联 关系 的 特定 记录 行 。 窗 口 可 见 记录 范围 的 设置 
是 通过 PARTITION BY 子 句 实现 的 ， 它 可 以 指示 PostgreSQL 仅 在 
满足 条 件 的 特定 记录 集 上 执行 聚合 操作 。 示 例 7-31 的 查询 与 示例 
7-30 类 似 ， 但 要 求 各 县 级 编号 作为 窗口 科 选 条 件 ， 该 编号 就 是 
eal 的 前 5 个 字符 。 这 样 就 实现 了 每 个 县 都 计算 各 自 的 平均 


示例 7-31 使 用 县 级 编写 作为 窗口 可 见 记录 范围 的 贤 选 条 件 

















SELECT tract id, val, AVG(val) OVER (PARTITION BY left(tract id,5)) As 
FROM census .facts 


WHERE fact type id = 2 ORDER BY tract id; 
tract id | val | val_avg county 

a oe ee Ne a ee 
256010601061060 | 1765 .0060 | 1769.9167142857142857 
250016010266 | 1366.000 | 1769.9167142857142857 


25661616268 | 984.666 | 1769.9167142857142857 


25663966166 | 1926.666 | 1438.2367692367692368 
25663966266 | 1968.666 | 1438.2367692367692368 
25663966366 | 1211.666 | 1438.2367692367692368 





7.3.2 ORDER BY 子 句 


窗口 函数 的 OVER 子 句 中 还 可 以 使 用 ORDER BY 子 句 ， 其 作用 可 以 
理解 为 对 窗口 可 见 范围 内 的 所 有 记录 进行 排序 ， 并 且 窗 口 可 见 记 录 
域 是 从 结果 集 的 第 一 条 记录 开始 到 当前 记录 为 止 的 范围 内 。 该 语法 
的 典型 应 用 场景 就 是 用 RON_NUMBER 函数 对 记录 集 编 号 。 示 例 7-32 
演示 了 如 何 对 各 人 口 普 查 区 记录 按照 其 名 称 顺 序 进行 编号 。 


示例 7-32 ”使 用 RON_NUMBER 窗口 函数 进行 编号 操作 














SELECT ROW NUMBER() OVER (ORDER BY tract name) As rnum, tract name 
FROM census.1lu tracts 
ORDER BY rnum LIMIT 4; 


rnum | tract_name 
十 站 


| Census Tract 1, Suffolk County, Massachusetts 

| Census Tract 1661，Suffolk County, Massachusetts 
| Census Tract 1662，Suffolk County, Massachusetts 
| Census Tract 1663，Suffolk County, Massachusetts 





示例 7-32 中 有 两 个 ORDER BY ， 前 一 个 在 OVER 子 句 内 和 生效， 表明 
窗口 可 见 区 内 的 记录 顺序 ， 后 一 个 针对 整 句 生效 ， 表 明 返 回 记 录 的 
整体 顺序 。 请 不 要 将 二 者 的 作用 域 混 消 。 


PARTITION BY 和 ORDER BY 可 以 联 用 ， 其 效果 就 是 对 PARTITION 
BY 指定 的 记录 集 进行 排序 。 示 例 7-33 还 是 复 用 了 前 面 的 例子 ， 但 
在 OVER 子 句 中 联 用 了 PARTITION BY 和 ORDER BY 。 





示例 7-33 联 用 PARTITION BY 和 ORDER BY 


SELECT tract id, val, 
SUM(val) OVER (PARTITION BY left(tract id,5) ORDER BY val) As sum_ 
FROM census.facts 
WHERE fact type id = 2 
ORDER BY left(tract id,5), val; 


25061614166 
25061611766 
25061610208 


25063933206 
25063934206 
250639313606 





可 以 看 到 ， 上 面 输出 的 合计 值 是 逐 行 累加 的 ， 这 就 是 在 OVER 子 句 
中 应 用 了 ORDER BY 后 的 效果 ， 即 窗口 可 见 域 是 从 排序 后 的 记录 集 
的 头条 记录 开始 ， 到 ORDER BY 字段 值 与 当前 记录 值 匹配 的 那 行 记 
录 为 止 ， 因 此 最 终 会 呈现 为 动态 累加 的 效果 。 例 如 ， 对 于 第 三 个 数 
据 分 区 中 的 第 五 条 记录 来 说 ， 合 计 值 仅 会 包含 该 分 区 中 的 前 五 条 记 
录 的 值 。 在 上 面 的 示例 中 ， 我 们 在 语句 的 最 后 加 上 了 ORDER BY 
left(tract_id,5)，val 这 个 排序 动作 ， 因 此 动态 累加 效果 一 日 
了 然 。 但 请 一 定 要 牢记 ，OVER 子 句 中 的 ORDER BY 与 整 句 尾部 的 
ORDER BY 的 作用 是 完全 不 同 的 。 


你 还 可 以 通过 RANGE 或 者 ROWS 关键 字 来 显 式 指定 窗口 的 可 见 记录 
域 。 例 如 : ROWS BETWEEN CURRENT RON AND 5 FOLLOWING 。 


PostgreSQL 还 支持 建立 命名 窗口 ， 该 功能 适用 于 在 同一 个 查询 中 使 
用 了 多 个 窗口 函数 ， 且 每 个 窗口 函数 的 窗口 定义 都 相同 的 情况 。 示 
例 7-34 演示 了 建立 命名 窗口 的 方法 ， 同 时 还 展示 了 LEAD 和 LAG 窗 
口 函 数 的 用 法 ， 这 两 个 窗口 函数 可 以 取出 当前 窗口 中 排 在 当前 记录 
行 之 前 或 者 之 后 的 记录 。 


示例 7-34 ”命名 窗口 以 及 LEAD 和 LAG 函数 的 用 法 


SELECT * FROM ( 
SELECT 
































ROW NUMBER() OVER( wt ) As rnum, © 
substring(tract id,1, 5) As county_code， 
tract_id, 
LAG(tract id,2) OVER wt As tract 2 before, 
LEAD(tract id) OVER wt As tract after 
FROM census.lu tracts 
WINDOW wt AS (PARTITION BY substring(tract id,1, 5) ORDER BY tract 
) As x 
WHERE rnum BETWEEN 2 and 3 AND county code IN ('2506067','2508625') 
ORDER BY county_ code, rnum; 


rnum | county code | tract id 


25067260266 25067200306 
25067260360 25067260166 250672004606 
25025060261 250256000202 
25025060262 250256060166 2502560600301 














@ 直接 复 用 窗口 名 ， 而 不 需要 把 窗口 的 完整 定义 再 输 一 
@ 将 我 们 的 窗口 命名 为 wt 窗口 。 


LEAD 和 LAG 函数 都 有 一 个 可 选 的 step 参数 ， 该 参数 可 以 是 正 数 
也 可 以 是 负数 ， 代 表 需 要 从 当前 记录 开始 向 前 或 者 向 后 跳 几 条 记录 
才能 访问 到 目标 记录 。 当 LEAD 和 LAG 在 寻找 目标 记录 的 过 程 中 跳 
了 当前 窗口 的 可 见 域 时 ， 就 会 返回 NULL 。 这 种 情况 经 常会 遇 

到 。 


请 注意 : 在 PostgreSQL 中 ， 系 统 目 带 的 以 及 用 户 自 定义 的 聚合 函 
数 都 可 以 作为 窗口 函数 使 用 ， 但 其 他 数据 库 一 般 仅 文 持 AVG 、SUM 
、MIN 、MAX 这 些 系统 内 置 人 聚合 函数 作为 窗口 函数 使 用 。 














01. 7.4 CTE 表 达 式 


公用 表 表达 式 〈CTE) 本 质 上 来 说 就 是 在 一 个 非常 庞大 的 SQL 语 
句 中 ， 人 允许 用 户 通 过 一 个 子 查 询 语句 先 定义 出 一 个 临时 表 ， 然 后 在 
这 个 庞大 的 SQL 语句 的 不 同 地 方 都 可 以 直接 使 用 这 个 临时 表 。 
CTE 本 质 上 就 是 当前 语句 执行 期 间 内 有 效 的 临时 表 ， 一 旦 当前 语句 
执行 完毕 ， 其 内 部 的 CTE 表 也 随 之 失效 。 


有 以 下 三 种 类 型 的 CTE。 
基本 CTE 

这 是 最 普通 的 CTE， 它 可 以 使 SQL 语句 的 可 读 性 更 高 ， 同 时 
规划 器 在 解析 到 这 种 CTE 时 会 判定 其 查询 代价 是 否 很 高 ， 如 果 是 
的 话 ， 会 考虑 将 其 查询 结果 临时 物化 存储 下 来 《此 处 概念 跟 物 化 视 
图 非常 类 似 ) ， 这 样 整个 SQL 语句 的 其 他 部 分 再 访问 此 CTE 时 就 
会 更 快 。 
可 写 CTE 

这 是 对 基本 CTE 的 一 个 功能 扩展 ， 其 内 部 可 以 执行 UPDATE 
、INSERT 或 者 DELETE 操作 。 该 类 CTE 最 后 一 般 会 返回 修改 后 的 
记录 集 。 
递归 CTE 


该 类 CTE 在 普通 CTE 的 基础 上 增加 了 一 个 循环 操作 。 在 执行 
过 程 中 ， 递 归 CTE 返回 的 结果 集会 有 所 变化 。 


PostgreSQL 文 持 可 写 的 递归 CTE 这 种 复合 类 型 。 
7.4.1 基本 CTE 用 法 介绍 


基本 CTE 的 用 法 如 示例 7-35 所 示 。WITH 关键 字 后 面 跟着 的 就 是 
CTE 表达 式 。 


示例 7-35 ”基本 CTE 














WITH cte AS ( 
SELECT 
tract id, substring(tract id,1, 5) As county_code， 
COUNT(*) OVER(PARTITION BY substring(tract id,1, 5)) As cnt_ tr 
FROM census.lu tracts 


) 


SELECT MAX(tract id) As last tract, county code, cnt tracts 
FROM cte 

WHERE cnt tracts > 160 

GROUP BY county code, cnt tracts; 





示例 7-35 中 CTE 表达 式 的 名 称 是 cte ， 其 本 体 是 由 一 个 SELECT 
语句 定义 出 来 的 ， 碍 询 字 段 列 表 中 包含 tract_id 
、country_code 、cnt_ tracts 三 个 列 。 外 围 的 SQL 语句 会 将 该 
CTE 作为 一 个 临时 表 来 使 用 。 


单个 SQL 语句 中 可 以 创建 多 个 CTE，CTE 之 间 使 用 逗号 分 隔 ， 所 
有 的 CTE 表达 式 都 要 落 在 WITH 子 句 范围 内 ， 有 具体 语法 如 示例 7-36 
所 示 。 多 个 CTE 表达 式 之 间 的 顺序 不 是 随便 排 的 ， 排 在 后 面 的 
CTE 可 以 引用 排 在 前 面 的 CTE， 但 反 过 来 不 行 。 除 了 这 一 点 以 

外 ， 多 个 CTE 之 间 的 排列 顺序 没有 别 的 讲究 。 


示例 7-36 多 个 CTE 的 用 法 


WITH 
cte1 AS( 
SELECT 
ract_id, 
ubstring(tract id,1, 5) As county_code， 
OUNT(*) OVER (PARTITION BY substring(tract id,1,5)) As cnt 
FROM census.lu tracts 
)， 
cte2 AS ( 
SELECT 


MAX(tract id) As last tract, 
county_code, 
cnt tracts 
FROM ctel 
WHERE cnt tracts < 8 GROUP BY county code, cnt tracts 


) 
SELECT c.last tract, f.fact type id, f.val 





FROM census .facts As f INNER JOIN cte2 c ON f.tract id = c.last tract; 


7.4.2 ”可 写 CTE 用 法 介绍 


可 写 CTE 扩展 了 CTE 的 功能 范畴 ， 从 只 读 扩展 为 可 写 。 下 面 使 用 
示例 6-3 中 创建 的 日 志 表 来 演示 此 功能 。 首 先 创 建 一 个 子 表 : 





CREATE TABLE logs 2611 61 62 ( 
PRIMARY KEY (log id), 
CONSTRAINT chk 
CHECK (log ts >= '2611-61-61' AND log ts < '2611-63-61') 


) 
INHERITS (1ogs_2611) ; 





在 示例 7-37 中 ， 我 们 将 父 表 的 部 分 数据 迁移 到 子 表 中 。 父 表 包 含 
了 2011 年 全 年 的 数据 ， 子 表 包 含 了 2011 年 1 月 和 2 月 的 数据 。 下 
面 的 语句 中 使 用 的 ONLY 关键 字 在 7.2.8 节 中 有 相关 介绍 ， 而 
RETURNING 关键 字 在 7.2.10 节 中 有 相关 介绍 。 


7-37 ”使 用 可 写 CTE 将 数据 从 一 个 分 文 移动 到 另 一 个 分 








WITH 七 As ( 
DELETE FROM ONLY logs 2811 WHERE log ts < “2611-63-61” RETURNING * 


INSERT INTO logs 2611 61 82 SELECT * FROM 七 ; 





7.4.3 ”递归 CTE 用 法 介绍 


PostgreSQL 官方 手册 中 对 递归 CTE 做 了 最 好 的 说 明 :“ 通 过 新 增 一 
个 可 选 的 RECURSIVE 修饰 符 ， 使 CTE 从 仅仅 能 提供 一 些 语法 便利 
升华 为 能 够 实现 标准 SQL 语法 无 法 实现 的 功能 。” 递 归 CTE 能 够 
使 用 递归 语法 构造 出 一 个 表达 式 ， 这 一 点 很 有 意思 。 递 归 CTE 使 
用 UNION ALL 语法 来 实现 每 次 运算 过 程 中 的 运算 结果 的 递归 宗 





积 。 


如 果 要 将 一 个 基本 CTE 转换 为 递归 CTE， 需 要 在 WITH 后 加 上 
RECURSIVE 修饰 符 。WITH RECURSIVE 后 面 可 以 附带 由 递归 表达 式 
和 非 递 归 表 达 式 结合 而 成 的 语句 。 在 大 多 数 其 他 数据 库 中 ， 如 果 要 
表达 递归 关系 ， 并 不 需要 显 式 指定 RECURSIVE 关键 字 。 


递归 CTE 常用 于 表达 消息 线程 和 其 他 树 状 结构 。 博 文 “Recursive 
CTE to Display Tree Structures” 中 提供 了 一 个 这 方面 的 例子 。 


0 7-38 中 ， 我 们 通过 查询 系统 catalog 来 展示 数据 库 中 的 级 联 


示例 7-38 ”递归 CTE 





WITH RECURSIVE tbls ASs ( 
SELECT 


c.oid As tableoid, 
n.nspname AS Schemaname， 
c.relname AS tablename © 
FROM 
pg_class c LEFT JOIN 
pg_namespace n ON n.oid = c.relnamespace LEFT JOIN 
pg_ tablespace t ON t.oid = c.reltablespace LEFT JOIN 
pg_inherits As th ON th.inhrelid = c.oid 


WHERE 

th.inhrelid IS NULL AND 

c.relkind = 'r'::"char" AND c.relhassubclass 
UNION ALL 
SELECT 


c.oid As tableoid, 

n.nspname AS Schemaname， 

tbls.tablename || '->' || c.relname AS tablename @ © 
FROM 

tbls INNER JOIN 

pg_inherits As th ON th.inhparent = tbls.tableoid INNER JOIN 

pg_class c ON th.inhrelid = c.oid LEFT JOIN 

pg_namespace n ON n.oid = c.relnamespace LEFT JOIN 
pg_tablespace t ON t.oid = c.reltablespace 


SELECT * FROM tbls ORDER BY tablename; @ 


tableoid | schemaname | tablename 
ee 二 +------------+--------------------------------------- 


3152249 | public | logs 
3152266 | public | logs->logs 2811 
3152272 | public | logs->logs 2611->logs_ 2611 61 62 











@ 查询 出 所 有 有 子 表 而 无 父 表 的 表 。 








本 


@ 输出 时 在 父 表 名 之 后 附加 子 表 的 名 称 。 


@ 输出 父 表 和 所 有 子 表 。 因 为 语句 中 要 求 输出 结果 按照 表 名 排 
序 ， 而 每 一 层级 的 表 名 是 将 父 表 的 名 称 排 在 子 表 之 前 ， 所 以 排序 后 
的 效果 束 是 子 表 记 录 紧 跟 在 其 父 表 记录 之 后 输出 。 














01. 7.5 LATERAL 横向 关联 语法 


LATERAL 是 9.3 版 中 新 支持 的 ANSI SQL 标准 语法 。 该 语法 的 用 途 
是 : 假设 你 需要 对 两 张 表 或 者 两 个 子 查 询 进 行 关联 查询 操作 ， 那 么 
参与 关联 运算 的 双方 是 独立 的 ， 互 相 不 能 读 取 对 方 的 数据 。 例 如 ， 

i 会 报错 ， 因 为 L.year=2611 不 是 位 于 关联 的 右 侧 

本 








SELECT * 
FROM 
census .facts L 
INNER JOIN 


SELECT * 


FROM census .lu _ fact types 
WHERE category = CASE WHEN L.yr = 2011 
THEN ‘Housing' ELSE category END 
) R 
ON L.fact type id = R.fact type_ id; 





加 上 了 LATERAL 关键 字 后 就 不 会 再 报错 : 


SELECT * 
FROM 
census.facts L INNER JOIN LATERAL 
( 
SELECT * 
FROM census.1lu fact types 


WHERE category = CASE WHEN L.yr = 2011 
THEN ‘Housing' ELSE category END 
) R 
ON L.fact type id = R.fact type_ id; 








通过 使 用 LATERAL 语法 ， 可 以 在 一 个 FROM 子 句 中 跨 两 个 表 共 享 多 
列 中 的 数据 。 但 有 个 限制 就 是 仅 文 持 单身 共享 ， 即 右 侧 的 表 可 以 提 
取 左 侧 表 中 的 数据 ， 但 反 过 来 不 行 。 


有 时 候 ， 为 了 避免 编号 语 法 极其 复杂 的 语句 ， 也 需要 使 用 LATERAL 
语法 。 在 示例 7-39 中 ， 关 联 关 系 中 左 侧 的 一 个 列 充当 了 右 侧 
generate_series 函数 的 一 个 形 参 。 








CREATE TABLE interval periods(i type interval) ; 
INSERT INTO interval periods (i type) 


VALUES ('5 months'), ('132 days'), ('4862 hours'); 





示例 7-39 LATERAL 语法 和 generate_series 函数 的 关联 
使 用 


SELECT i type, dt 
FROM 

interval periods CROSS JOIN LATERAL 

generate series('26012-61-61'::date, '20612-12-31'::date, i type) As 
WHERE NOT (dt = '28612-61-61' AND i type = '132 days'::interval); 


2012-01-61 
2012-06-61 
2012-11-61 
26012-05-12 
2012-09-21 
4862:06:060 2012-01-61 
4862:06:060 2012-07-21 











LATERAL 语法 还 可 用 于 以 下 场景 : 通过 关联 关系 左 侧 的 数据 来 限制 
右 侧 的 查询 结果 集中 包含 的 记录 数量 。 在 示例 7-40 中 ， 我 们 使 用 
LATERAL 语法 查询 出 最 近 100 天 之 内 登录 过 我 们 网 站 

(http://www.postgresonline.com ) 的 超级 用 户 最 近 5 次 登录 的 时 间 
和 操作 日 志 。 本 例 中 使 用 的 表 是 在 6.1.5 节 和 6.1.1 节 中 创建 的 。 


示例 7-40 ”使 用 LATERAL 语法 来 限制 关联 查询 中 的 一 方 返回 
的 记录 数 


SELECT u.user_name，1.description，1.1og ts 
FROM 








super_users AS U CROSS JOIN LATERAL ( 

SELECT description, log ts 

FROM logs 

WHERE 
log ts > CURRENT_ TIMESTAMP - interval "166 days' AND 
logs.user name = U.User_name 

ORDER BY log ts DESC LIMIT 5 

) AS 1; 





虽然 你 也 可 以 通过 窗口 函数 来 实现 相同 的 效果 ， 但 LATERAL 关联 
执行 速度 更 快 ， 语 法 也 更 简洁 。 


在 同一 条 SQL 语句 中 可 以 多 次 使 用 LATERAL 关联 ， 当 需要 关联 多 





个 子 查询 时 ， 甚 至 可 以 级 联 使 用 LATERAL 。 在 有 的 场景 下 可 以 省 
略 LATERAL 关键 字 ， 此 时 规划 器 会 根据 关联 关系 的 两 边 交 又 引用 
的 情况 智能 判断 出 这 是 一 个 LATERAL 操作 。 但 为 了 清晰 起 见 ， 最 
好 显 式 指定 LATERAL 关键 字 。 在 不 支持 LATERAL 语法 的 
PostgreSQL 版 本 上 执行 带 横 癌 引 用 的 SQL 语句 当然 会 报错 。 不 显 
式 指明 LATERAL 关键 字 还 有 一 个 风险 ， 束 是 可 能 会 造成 规划 器 误 
判 ， 最 终生 成 的 执行 计划 可 能 完全 不 是 你 想 要 的 。 


其 他 数据 库 中 也 提供 了 横向 关联 的 能 力 ， 但 其 语法 不 符合 ANSI 
SQL 规范 的 要 求 。 在 Oracle 中 ， 横 向 关联 通过 管道 函数 实现 ， 在 
SQL Server 中 使 用 CROSS APPLY 或 者 OUTER APPLY 语法 来 实现 。 


01. 7.6 ”WWITH ORDINALITY 子 句 


PostgreSQL 9.4 开始 支持 ANSI SQL 标准 中 规定 的 WITH 
ORDINALITY 语法 。WITH ORDINALITY 子 句 的 作用 是 为 函数 返回 
的 结果 集中 的 每 一 行 自动 附加 一 个 序列 号 字段 。 





和 在 普通 的 表 查 询 语 句 和 子 查询 语句 中 不 可 以 使 用 WITH 
ORDINALITY 语法 ， 但 可 以 使 用 ROW_NUMBER 窗口 函数 ， 效 果 
相同 。 


你 会 发 现 ，WITH ORDINALITY 经 常 与 generate _ series 
、unnest 之 类 可 以 将 复合 数据 类 型 和 数组 展开 的 函数 联 用 。 事 实 
上 ，WITH ORDINALTY 语法 可 与 任何 返回 多 条 记录 的 函数 联 用 ， 包 
括 用 户 自 定义 的 函数 。 


示例 7-41 演示 了 WITH ORDINALITY 与 generate_series 函数 生 
成 的 临时 变量 联 用 的 场景 。 


示例 7-41 ”对 函数 返回 的 多 条 记录 结果 进行 编号 











SELECT dt.* 
FROM generate series('206016-61-061'::date,'26016-12-31'::date,interval '1 
WITH ORDINALITY As dt; 


dt | ordinality 
ER ONE ts 
2616-61-61 60:60:60-65 | 1 
2616-62-61 60:60:60-65 | 2 
2616-63-61 60:60:60-65 | 3 
2616-64-61 60:60:60-64 | 4 
2016-65-61 6860:60:600-064 | 5 
2016-66-61 860:60:600-064 | 6 
2016-67-61 860:60:600-064 | 7 
2016-608-61 860:60:600-064 | 8 
2616-69-61 66:66:68-64 | 9 
2616-16-61 66:66:68-64 | 16 
2616-11-61 66:66:66-64 | 11 
2616-12-61 60:60:60-65 | 12 


(12 rows) 


[L | 


WITH ORDINALITY 会 在 查询 结果 的 最 后 增加 一 个 名 为 
ordinality 的 字段 ，WITH ORDINALITY 子 句 只 能 出 现在 SQL 语 
名 的 FROM 子 句 中 。ordinality 字段 可 以 改 为 其 他 名 字 。 


WITH ORDINALITY 子 句 与 LATERAL 语法 经 常会 联 用 。 在 示例 7-42 
中 ， 我 们 复 用 了 示例 7-39 中 的 LATERAL 例句 ， 同 时 为 返回 的 记录 
增加 了 一 个 序列 号 。 


示例 7-42 将 WITH ORDINALITY 与 LATERAL 联 用 





SELECT d.ord, i type，d.dt 
FROM 


interval_periods CROSS JOIN LATERAL 

generate series('26012-61-61'::date, "2612-12-31'::date，i type) 
WITH ORDINALITY AS d(dt,ord) 
WHERE NOT (dt = '28612-61-061' AND i type = '132 days'::interval); 


2012-601-61 
2012-66-061 
2012-11-61 
2012-65-12 
2012-69-21 
2012-601-61 
4862:60:060 2012-67-21 
(7 rows) 








在 示例 7-42 中 ，WITH ORDINALITY 与 返回 多 行 记录 的 函数 联 用 ， 
它 只 能 在 WHERE 子 句 之 前 的 FROM 部 分 生效 ， 因 此 查询 得 到 的 最 终 
结果 中 会 出 现 序号 非 连续 的 情况 〈 比 如 上 例 中 的 132 days 对 应 的 

序号 1 就 没有 了 ) ， 其 原因 是 有 的 记录 被 WHERE 条 件 过 滤 掉 了 。 





01. 7.7 GROUPING SETS 、CUBE 和 ROLLUP 语法 


如 果 你 需要 创建 一 个 包含 总 计 和 分 子 类 总 计 的 报表 ，GROUPING 
SETS 就 是 为 这 种 场景 量 身 定做 的 。 


还 是 以 前 面 使 用 的 学 生 测 试 成 绩 表 为 例 。 如 果 需 要 同时 统计 每 个 学 
生 的 综合 平均 分 和 每 个 科目 的 平均 分 ， 可 以 写 一 个 类 似 示例 7-43 
的 SQL 语句 来 达成 目标 ， 其 中 使 用 了 GROUPING SETS 语法 。 


示例 7-43 ”统计 每 个 学 生 的 综合 平均 分 以 及 每 个 学 生 分 科目 
的 平均 分 


SELECT student, subject, AVG(score)::numeric(10,2) 
FROM test_ scores 

WHERE student IN ('leo','regina') 

GROUP BY GROUPING SETS ((student), (student,subject)) 
ORDER BY student, subject NULLS LAST; 


algebra 
calculus 
chemistry 
physics 
NULL 
regina algebra 
regina calculus 
regina chemistry 
regina economics 
regina physics 
regina NULL 
(11 rows) 





示例 7-43 通过 单个 SQL 语句 就 统计 出 了 每 个 学 生 所 有 科目 的 平均 
分 以 及 每 个 学 生 每 个 科目 的 平均 分 。 


同 理 ， 我 们 甚至 能 够 再 加 上 每 门 科目 所 有 学 生 的 平均 分 ， 依 然 是 借 
助 GROUPING SETS 的 能 力 来 实现 ， 如 示例 7-44 所 示 。 


示例 7-44 ”统计 每 个 学 生 的 综合 平均 分 、 每 个 学 生 分 科目 的 
平均 分 以 及 茶 个 科目 所 有 学 生 的 平均 分 


SELECT student, subject, AVG(score)::numeric(10,2) 

FROM test_ scores 

WHERE student IN ('leo','regina') 

GROUP BY GROUPING SETS ((student,subject), (student),(subject)) 
ORDER BY student NULLS LAST, subject NULLS LAST; 


algebra 
calculus 
chemistry 
physics 
NULL 
regina algebra 
regina calculus 
regina chemistry 
regina economics 
regina physics 
regina NULL 
NULL algebra 
NULL calculus 
NULL chemistry 
NULL economics 
NULL physics 
(16 rows) 





如 采 希 望 一 次 性 统计 出 每 个 学 生 的 综合 平均 分 、 每 个 学 生 分 科目 的 
综合 平均 分 和 全 局 综合 平均 分 ，it 六 怎么 办 呢 ? 可 以 把 查询 修改 为 

GROUPING SETS((student), (student, subject),()) ， 这 种 
递 进 式 的 分 组 聚合 可 以 用 ROLLUP(student, subject) 来 表达 ， 具 
体 参 见 示例 7-45。 


示例 7-45 ”统计 每 个 学 生 的 综合 平均 分 、 每 个 学 生 分 科目 的 
平均 分 以 及 全 局 综合 平均 分 





SELECT student, subject, AVG(score)::numeric(10,2) 
FROM test_ scores 

WHERE student IN ('leo','regina') 

GROUP BY ROLLUP (student,subject) 


ORDER BY student NULLS LAST, subject NULLS LAST; 


student | subject | avg 
0 A 
leo | algebra | 82.66 
leo | calculus | 65.56 
leo | chemistry | 75.56 
leo | physics | 72.66 
leo | NULL | 73.75 
regina | algebra | 72.56 
regina | calculus | 64.56 
regina | chemistry | 73.56 
regina | economics | 98.66 
regina | physics | 84.66 
regina | NULL | 75.44 
NULL | NULL | 74.65 
(12 rows) 





如 果 把 ROLLUP 的 入 参 字 段 顺 序 反 过 来 ， 那 么 得 到 的 是 每 个 学 生 分 
科目 的 平均 分 、 每 个 科目 的 平均 分 、 全 局 综合 平均 分 ， 如 示例 7-46 
所 示 。 


示例 7-46 ”统计 每 个 学 生 分 科目 的 平均 分 、 每 个 科目 的 平均 
分 、 全 局 综合 平均 分 





SELECT student, subject, AVG(score)::numeric(10,2) 
FROM test scores 

WHERE student IN ('leo','regina') 

GROUP BY ROLLUP (subject,student) 

ORDER BY student NULLS LAST, subject NULLS LAST; 


student | subject | avg 

et a ee 
leo | algebra | 82.66 
leo | calculus | 65.56 
leo | chemistry | 75.56 
leo | physics | 72.66 
regina | algebra | 72.56 
regina | calculus | 64.56 
regina | chemistry | 73.56 
regina | economics | 98.66 
regina | physics | 84.66 
NULL | algebra | 77.25 


NULL | calculus | 65.66 
NULL | chemistry | 74.56 
NULL | economics | 96.66 
NULL | physics | 78.66 
NULL | NULL | 74.65 
(15 rows) 





如 果 和 希望 把 前 两 种 统计 的 结果 综合 一 下 ， 即 包含 每 个 学 生 所 有 科目 
的 综合 平均 分 、 每 个 科目 所 有 学 生 的 综合 平均 分 、 每 个 学 生 每 个 科 
目的 平均 分 以 及 全 局 不 分 科目 和 学 生 的 综合 平均 分 ， 那 么 可 以 写成 
GROUPING SETS((student), (student, subject), 
(subject)，()) ， 或 者 可 以 使 用 CUBE(student，subject) 语 
法 ， 如 示例 7-47 所 示 。 


示例 7-47 统计 每 个 学 生 所 有 科目 的 综合 平均 分 、 每 个 科目 所 
有 学 生 的 综合 平均 分 、 每 个 学 生 每 个 科目 的 平均 分 以 及 全 局 不 
分 科目 和 学 生 的 综合 平均 分 





SELECT student, subject, AVG(score)::numeric(10,2) 
FROM test_ scores 

WHERE student IN ('leo','regina') 

GROUP BY CUBE (student, subject) 

ORDER BY student NULLS LAST, subject NULLS LAST; 


student | subject | avg 

A ER RT 
leo | algebra | 82.66 
leo | calculus | 65.56 
leo | chemistry | 75.56 
leo | physics | 72.66 
leo | NULL | 73.75 
regina | algebra | 72.56 
regina | calculus | 64.56 
regina | chemistry | 73.56 
regina | economics | 98.66 
regina | physics | 84.66 
regina | NULL | 75.44 
NULL | algebra | 77.25 
NULL | calculus | 65.66 
NULL | chemistry | 74.56 
NULL | economics | 96.66 
NULL | physics | 78.66 


NULL | NULL | 74.65 
(17 rows) 





01. 


第 8 章 函数 编 与 


PostgreSQL 同 大 多 数 数据 库 一 样 ， 可 以 把 辱 干 SQL 语句 组 合 在 一 
起 ， 然 后 将 其 作为 一 个 单元 来 处 理 ， 并 且 每 次 运行 时 可 以 输入 不 同 
的 参数 。 这 种 机 制 在 不 同 数据 库 中 的 名 称 不 一 样 ， 有 的 叫 存储 过 
程 ， 有 的 叫 用 户 目 定义 函数 ， 而 PostgreSQL 统一 称 之 为 函数 。 


函数 不 是 仅仅 将 一 堆 SQL 语句 编排 在 一 起 即 可 ， 其 中 还 需要 使 用 
过 程式 语言 〈procedural language，PL) 来 对 SQL 语句 的 执行 过 程 
进行 控制 。 在 PostgreSQL 中 ， 你 可 以 选择 使 用 不 同 的 语言 来 编写 
函数 ， 而 且 可 选择 的 语言 有 很 多 ， 其 中 SQL、C、PL/pgSQL、 
PL/Perl 以 及 PL/Python 一 般 都 会 随 PostgreSQL 安装 包 附 带 。 此 外 
还 支持 使 用 PL/V8 语言 ， 通 过 它 你 可 以 使 用 JavaScript 语言 来 编写 
函数 。PL/V8 是 Web 开发 人 员 的 最 爱 ， 因 为 JSON、JSONB 数据 
类 型 和 JavaScript 语言 是 绝 配 。 关 于 JSON 和 JSONB 数据 类 型 的 详 
情 ， 请 参考 5.6 节 。 


你 还 可 以 按 需 安装 PL/R、PL/Java、PL/sh、PL/TSQL 等 语言 扩展 ， 
此 外 还 有 一 些 用 于 高 端 数据 处 理 以 及 人 工 智能 处 理 的 试验 性 语言 ， 
比如 PL/Scheme 和 PL/OpenCL 等 。 你 可 以 在 官方 手册 的 “过 程式 语 
言 ”一 节 中 查 到 PostgreSQL 支持 的 完整 语言 列表 。 

















01. 8.1 PostgreSQL 函数 功能 剖析 
PostgreSQL 的 函数 可 分 为 基本 函数 、 聚 合 函 数 、 窗 口 函 数 和 触发 器 
函数 四 大 类 。 我 们 首先 介绍 关于 函数 的 基础 知识 ， 然 后 再 详细 介绍 
前 述 每 类 函数 的 具体 特性 。 
8.1.1 函数 功能 基础 知识 介绍 


在 PostgreSQL 中 ， 不 管 你 选择 使 用 何 种 编程 语言 ， 所 编写 出 来 的 
函数 的 结构 都 是 类 似 的 ， 如 示例 8-1 所 示 。 


示例 8-1 ”函数 的 基本 结构 


CREATE OR REPLACE FUNCTION func name(argl1 argl1 datatype DEFAULT arg1 d 
RETURNS some type | set of some type | TABLE (..) AS 
$$ 


BODY of function 


$9$ 
LANGUAGE language of function 





参数 可 以 有 默认 值 。 尔 数 调 用 者 可 以 忽略 有 默认 值 的 参数 ， 即 不 用 
为 其 输入 值 ， 直 接 采 用 默认 值 即 可 。 在 函数 定义 中 ， 可 选 参数 必须 
排列 在 必 选 参数 的 后 面 。 


入 参 文 持 命名 参数 和 匿名 参数 两 种 形式 ， 前 者 必须 为 参数 起 个 名 
字 ， 而 后 者 不 需要 。 我 们 建议 使 用 命名 参数 ， 因 为 这 样 可 以 在 冰 数 
体内 通过 参数 名 引用 它 ， 非 常 方 便 和 直观 。 假 设 我 们 定义 了 一 个 可 
以 接受 三 个 入 参 的 函数 (其 中 两 个 入 参 是 可 选 的 ) 如 下 : 


big elephant(ear size numeric, skin color text DEFAULT 'blue', 
name text DEFAULT "Dumbo ') 





你 可 以 在 函数 体内 部 通过 参数 名 引用 这 些 入 参 (ear_size 


、Skin_color 等 ) 。 如 果 参 数 是 匿名 的 ， 那 么 只 能 通过 序列 号 的 


方式 来 访问 它 : $1、$2 和 $3。 


如 果 使 用 了 命名 参数 ， 那 么 调用 函数 时 还 可 以 采用 以 下 带 入 参 名 的 
调用 方式 ， 该 方式 的 好 处 是 参数 输入 顺序 与 定义 时 的 顺序 不 必 完 全 
相同 : 


big elephant(name => 'Wooly', ear_ size => 1.2) 





即使 函数 定义 时 使 用 了 命名 入 参 ， 也 可 以 按照 参数 位 置 来 输入 而 不 
必 带 上 参数 的 名 字 ， 比 如 big elephant(1.2，'blue '， 
'Wooly' ) 。 那 么 什么 时 候 需 要 使 用 带 入 参 名 的 调用 方式 呢 ? 如 果 
函数 有 多 个 入 参 ， 并 且 其 中 大 部 分 都 是 可 选 的 ， 那 么 此 时 适合 使 用 
带 参数 名 的 调用 方式 。 该 方式 可 以 实现 覆盖 参数 默认 值 ， 而 且 参 数 
的 输入 顺序 与 定义 时 的 顺序 不 必 相 同 。 以 上 面 对 big_elephant 函 
数 的 调用 为 例 ，skin_color 参数 未 出 现 ， 因 此 会 取 默 认 值 
'blue' ，name 参数 的 值 会 覆盖 默认 值 ， 而 且 name 定义 时 在 最 
后 ， 调 用 时 却 放 在 了 第 一 个 。 如 果 按 参数 位 置 的 形式 来 调用 ， 那 么 
要 想 给 name 赋值 以 覆盖 其 默认 值 的 话 ，skin_color 参数 就 必须 
要 显 式 输入 。 





外 在 PostgreSQL 9.5 以 及 更 高 的 版 本 中 ， 带 参数 名 的 调用 
语法 是 类 似 name => 'Wooly' 这 样 的 ， 但 是 在 PostgreSQL 
9.4 以 及 之 前 的 版 本 中 ， 语 法 是 name := 'Wooly' 。 为 保证 
前 向 兼容 ，arg1_name := arg1_value 这 种 语法 在 
PostgreSQL 9.5 及 之 后 的 版 本 中 仍 是 文 持 的 ， 但 不 建议 继续 使 
用 ， 因 为 将 来 会 不 再 文 持 。 


定义 函数 时 可 以 谎 加 一 些 标记 符 来 优化 执行 效率 或 者 提升 安全 性 ， 
支持 的 标记 符 如 下 。 


LANGUAGE (使 用 的 编程 语言 
指明 本 函数 使 用 的 编程 语言 ， 当 然 该 语言 必须 在 当前 函数 所 在 


的 database 中 已 安装 。 执 行 SELECT lanname FROM 
pg_language; 即 可 查 到 已 安装 的 语言 列表 。 


VOLATILITY (结果 的 稳定 性 ) 

该 标记 符 可 以 告诉 查询 规划 器 ， 当 该 函数 执行 完毕 后 ， 得 到 的 
结果 是 否 可 以 缓存 下 来 以 供 下 次 使 用 。 它 有 以 下 几 个 可 选 值 。 
IMMUTABLE 〈 结 果 恒 定 不 变 ) 

任何 情况 下 ， 只 要 调用 该 函数 时 使 用 相同 的 输入 ， 就 总 会 得 到 
相同 的 输出 。 也 就 是 说 ， 该 函数 的 内 部 逻辑 对 外 界 完 全 无 依赖 。 这 


类 函数 最 典型 的 例子 是 数学 计算 函数 。 注 意 ， 定 义 函 数 索 引 时 必须 
使 用 IMMUTABLE 函数 。 








STABLE (结果 相对 稳定 ) 


如 果 在 同一 个 但 询 语句 中 多 次 调用 该 函数 ， 则 每 次 调用 时 只 要 
使 用 相同 的 输入 束 总 会 得 到 相同 的 输出 。 也 就 是 说 ， 该 函数 的 内 部 
逻辑 在 当前 SQL 的 上 下 文 环境 内 是 有 恒定 输出 的 。 


VOLATILE (结果 不 稳定 ) 


每 次 调用 该 函数 得 到 的 结果 可 能 都 不 同 ， 即 便 每 次 都 使 用 相同 
的 输入 也 是 这 样 。 那 些 更 改 数 据 的 函数 和 那些 依赖 系统 时 间 这 类 环 
境 设置 的 函数 就 属于 VOLATILE 类 型 。 该 项 也 是 默认 值 。 


请 注意 ，VOLATILITY 标记 符 仅 仅 是 给 规划 堪 提 供 了 一 个 提示 
言 息 ， 规 划 器 并 不 一 定 会 按照 此 设置 来 进行 处 理 。 如 果子 数 被 标记 
为 VOLATILE ， 那 么 规划 器 每 次 遇 到 此 函数 都 会 重新 解析 并 重新 执 
行 一 遍 ， 如 果 被 标记 为 别 的 类 型 ， 那 么 规划 器 也 可 能 不 会 对 其 执行 
结果 进行 缓存 ， 因 为 规划 器 可 能 认为 重新 计算 一 遍 反 而 会 更 快 。 
STRICT (严格 模式 ) 

对 于 一 个 严格 模式 的 函数 来 说 ， 如 果 有 任何 输入 为 NULL ， 则 
规划 器 根本 不 会 执行 这 个 函数 ， 直 接 返 回 NULL 。 如 果 未 显 式 指定 
为 STRICT 模式 ， 则 函数 默认 都 是 非 严 格 模式 的 。 写 函数 时 ， 务 必 


慎 用 STRICT ， 因 为 用 了 以 后 可 能 会 导致 规划 器 不 使 用 索引 。 请 参 
考 我 们 的 博文 “STRICT on SQL Functions” 以 获取 更 多 细节 。 


COST (执行 成 本 估计 ) 

















这 是 标记 函数 中 计算 操作 密集 程度 的 一 个 相对 度量 值 。 如 果 使 
用 的 是 SQL 或 PL/pgSQL 语言 ， 则 该 值 为 196 ; 如 果 使 用 C 语 
言 ， 则 该 值 为 1 。 该 值 会 影响 到 规划 器 执行 WHERE 子 句 中 的 函数 
时 的 优先 级 ， 也 会 影响 到 是 否 对 此 函数 进行 结果 集 缓存 的 可 能 性 判 
定 。 此 值 越 大 ， 则 规划 器 会 认为 执行 该 函数 需要 耗 纤 的 时 间 越 多 。 


ROWS (返回 结果 集 的 行 数 估计 ) 


仅 当 函数 返回 的 是 一 个 结果 集 时 ， 此 标记 符 才 有 用 。 该 值 是 返 
回 的 结果 集中 记录 数 的 一 个 估计 值 。 规 划 器 会 利用 此 数值 来 为 此 函 
数 分 析 得 出 最 佳 的 执行 策略 。 


SECURITY DEFINER 〈 安 全 控制 符 ) 


如 果 设 置 了 安全 控制 符 ， 则 会 以 创建 此 函数 的 用 户 的 权限 执行 
此 函数 ， 如 果 未 设置 ， 则 会 以 调用 此 函数 的 用 户 的 权限 执行 此 函 
数 。 如 果 某 用 户 对 某 张 表 没 有 操作 权限 而 又 需要 操作 该 表 ， 那 么 就 
可 以 让 创建 该 表 的 用 户 提供 一 个 带 SECURITY DEFINER 标识 的 函 
数 来 对 此 表 进行 操作 。 可 以 看 出 ， 当 需要 进行 表 的 访问 权 控 制 时 ， 
这 个 安全 控制 符 还 是 很 有 用 的 。 
PARALLEL (并 行 度 ) 

该 标记 符 是 PostgreSQL 9.6 新 引入 的 。 该 标记 表示 人 允许 规划 器 
以 并 行 模式 运行 。 默 认 情 况 下 ， 函 数 会 被 设置 为 PARALLEL 
UNSAFE ， 这 意味 着 任何 调用 该 函数 的 语句 都 不 会 被 分 布 到 多 个 工 
作 进 程 上 去 并 发 执行 。 详 情 请 参考 官方 手册 “并 行 安 全 性 ”相关 内 
容 。 支 持 的 选项 如 下 。 
SAFE 


该 选项 表示 允许 该 函数 被 并 行 执行 。 如 果 函 数 是 IMMUTABLE 
类 型 的 ， 或 者 函数 不 更 新 数据 或 者 不 会 修改 事务 状态 或 其 他 变量 
值 ， 那 么 将 其 设 为 SAFE 一 般 是 没 问 题 的 。 
UNSAFE 


如 果 函 数 会 修改 非 临 时 数据 、 访 问 厅 列 号 生成 费 或 者 事务 状 




















态 ， 那 么 都 应 被 设置 为 UNSAFE 。UNSAFE 的 函数 如 果 以 并 行 模 式 
执行 可 能 会 导致 表 数据 被 破坏 或 者 其 他 系统 状态 被 破坏 ， 因 此 不 允 
许 被 并 行 执行 。 
RESTRICTED 

对 于 使 用 临时 表 、 预 解析 语句 或 者 客户 端 连接 状态 的 函数 可 以 
使 用 该 选项 。 设 置 为 RESTRICTED 的 语句 不 会 被 禁止 并 行 执行 ， 但 
是 它 只 能 运行 在 并 行 组 中 的 领导 组 〈lead) 中 ， 也 就 是 说 该 函数 本 
身 不 会 被 并 行 执行 ， 但 它 不 会 阻止 调用 它 的 SQL 语句 被 并 行 执 
fT 











本 章 的 很 多 例子 中 都 带 有 PARALLEL 标记 符 ， 如 果 你 的 试验 环境 是 
PostgreSQL 9.6 之 前 的 版 本 ， 请 在 执行 例子 时 把 PARALLEL 标记 去 
掉 。 


8.1.2 ”触发 器 和 触发 器 函数 


任何 一 个 功能 健全 的 数据 库 都 文 持 触 发 右 功 能 。 借 助 触发 右 机 制 ， 
可 以 实现 自动 捕捉 数据 变化 事件 并 进行 相应 处 理 。PostgreSQL 既 文 
持 对 表 创 建 触发 器 ， 也 文 持 对 视图 创建 触发 大 。 


可 以 指定 触发 器 在 语句 级 或 者 记录 级 被 触发 。 对 语句 级 触发 堪 来 
说 ， 每 执行 一 条 SQL 语句 只 会 被 触发 一 次 ， 对 记录 级 触发 右 来 
说 ，SQL 语句 执行 过 程 中 每 修改 一 条 记录 就 会 被 触发 一 次 。 例 如 ， 
假设 你 对 某 表 执行 了 一 个 UPDATE 语句， 更 新 了 1500 条 记录 。 那 
人 该 表 上 的 语句 级 触发 占 只 会 触发 -次 ， 而 记录 级 触发 右 会 触发 
1500 次 。 


你 还 可 以 更 加 精细 地 设置 触发 器 的 触发 时 机 ， 系 统 支 持 BEFORE 
、AFTER 以 及 INSTEAD OF 这 三 种 时 机 。BEFORE 类 的 触发 右 会 在 
语句 执行 之 前 或 者 记录 行 被 修改 之 前 触发 ， 你 可 以 借 此 时 机 来 取消 
此 次 修改 或 者 对 要 修改 的 数据 进行 预先 备份 。AFTER 类 的 触发 器 会 
在 语句 执行 之 后 或 者 记录 行 被 修改 之 后 触发 ， 你 可 以 借 此 时 机 来 获 
得 修改 后 的 新 值 ， 该 类 触发 器 一 般 用 于 记录 修改 日 志 或 者 进行 数据 
复制 。INSTEAD OF 类 的 触发 器 会 将 原 语句 的 操作 内 容 蔡 换 

掉 。BEFORE 和 AFTER 类 的 触发 器 只 能 用 于 表 ， 而 INSTEAD OF 类 
的 触发 器 只 能 用 于 视图 。 











注意 ， 如 果 要 在 触发 器 函数 中 进行 数据 修改 ， 那 么 该 触发 器 的 触发 
时 机 一 定 只 能 是 BEFORE 类 的 ， 因 为 在 AFTER 阶段 所 有 针对 新 记录 
的 修改 操作 都 会 被 忽略 。 


你 还 可 以 在 定义 触发 器 时 加 上 WHEN 和 条件， 以 限定 只 有 那些 满足 得 
选 条 件 的 记录 被 修改 时 才 激 活该 触发 器 ;也 可 以 通过 加 上 “UPDATE 
OF + 字段 列表 ” 子 句 来 指定 只 有 修改 了 特定 的 列 时 才 激 活该 触发 
器 。 如 果 和 希望 更 加 深入 细致 地 了 解 触 发 器 与 主体 语句 之 间 的 触发 联 
动机 制 ， 请 参考 PostgreSQL 官方 手册 中 的 “触发 器 行为 概览 > 一 节 
的 内 容 。 我 们 还 在 示例 7-5 中 演示 了 一 个 视图 触发 器 的 用 法 。 


PostgreSQL 提供 了 一 种 专门 用 于 处 理 触 及 器 逻辑 的 函数 ， 称 为 触 故 
需 畏 数 ， 其 行为 模式 与 其 他 函数 类 似 ， 内 部 的 代码 结构 也 相同 。 
触发 器 函数 与 普通 函数 的 唯一 区 别 在 于 输入 形 参 和 输出 类 型 。 触 发 
站 因为 可 以 在 函数 内 部 访问 数据 并 对 其 进行 修 
改 。 


触发 器 函数 的 返回 值 永远 是 trigger 类 型 。PostgreSQL 的 触发 器 
函数 与 其 他 函数 类 似 ， 因 此 一 个 触发 右 函 数 可 以 被 多 个 触发 堪 共 
用 。 几 乎 没有 哪 家 数据 库 能 支持 该 特性 ， 因 为 一 般 的 数据 库 中 都 是 
把 触发 器 和 触发 堪 函 数 作为 一 个 完整 的 对 象 绑 定 在 一 起 鸭 ， 这 样 的 
触发 堪 处 理 逻 辑 无 法 被 别 的 触发 器 重用 。 


在 PostgreSQL 中 ， 每 个 触发 器 有 且 仪 有 一 个 配套 的 触发 器 函数 。 
如 采 由 于 业务 需要 必须 将 逻辑 分 散 到 多 个 触发 右 函 数 中 ， 那 么 就 得 
创建 多 个 触发 器 来 调用 它们 ， 这 些 触发 器 的 触发 事件 可 以 相同 也 可 
以 不 同 。 如 果 触 发 事件 相同 的 话 ， 那 么 系统 会 将 触发 占 名 称 按 字 典 
顺序 进行 排序 ， 然 后 逐个 触发 。 后 一 个 触发 右 可 以 看 到 前 一 个 触及 
器 的 修改 结果 。 每 一 个 触发 器 并 不 是 一 个 独立 的 事务 ， 因 此 如 果 在 
菏 个 触发 器 中 执行 了 回 滚 操 作 ， 那 么 在 此 触发 器 之 前 执行 过 的 触发 
需 修 改 都 会 被 回 滚 兵 。 


你 可 以 使 用 PostgreSQL 支持 的 任何 一 种 编程 语言 来 编写 触发 器 函 
数 ， 但 注意 不 能 使 用 SQL， 因 为 它 不 是 过 程式 语言 。SQL 对 应 的 
过 程式 语言 是 PL/pgSQL， 它 也 是 目前 为 止 在 PostgreSQL 环境 中 使 
. 最 广泛 的 语言 。8.3.2 节 会 演示 如 何 使 用 PL/pgSQL 编写 触发 器 函 


























8.1.3 ”聚合 操作 


大 多 数 其 他 数据 库 仅 允许 使 用 ANSI SQL 标准 中 定义 的 那些 聚合 函 
数 ， 比 如 MIN 、MAX 、AVG 、SUM 和 COUNT 等 。 在 PostgreSQL 中 
则 无 此 限制 ， 你 可 以 自行 实现 比 以 上 函数 功能 更 复杂 的 聚合 函数 。 
在 PostgreSQL 中 ， 一 个 聚合 函数 同时 也 可 以 作为 窗口 函数 〈 相 关 
概念 请 参见 7.3 节 ) 来 使 用 ， 因 此 你 可 以 实现 事半功倍 的 效果 。 


你 可 以 使 用 PostgreSQL 所 支持 的 几乎 任何 语言 (包括 SQL 语言 在 
内 ) 来 编写 肾 合 函数 。 聚 合 函 数 一 般 是 基于 一 个 或 者 多 个 子 函 数 实 
现 的 。 前 先 人 至 少 得 有 一 个 状态 转换 函数 ， 该 函数 会 反复 执行 多 次 ， 
以 将 输入 的 多 行 记录 聚合 为 一 个 单独 的 结果 。 你 还 可 以 建立 用 于 处 
理 初 始 状态 和 终结 状态 的 函数 ， 不 过 这 两 个 函数 是 可 选 的 。 前 述 这 
几 类 函数 都 是 聚合 函数 的 子 函数 ， 它 们 可 以 使 用 不 同 的 编程 语言 来 
实现 ， 我 们 在 “PostgreSQL Aggregates” 这 篇 博文 中 演示 了 基于 
PL/pgSQL、PL/Python 和 SQL 等 多 种 语言 的 子 函 数 构 造 而 成 的 聚 
合 函 数 示 例 。 


不 管 你 使 用 何 种 编程 语言 来 编写 这 些 子 图 数 ， 最 终 将 它们 整合 为 一 
个 聚合 函数 的 语法 是 一 样 的 ， 如 下 所 示 。 











CREATE AGGREGATE my_agg (input data type) ( 
SFUNC=state function name， 

STYPE=state type, 

FINALFUNC=final function name, 


INITCOND=initial state value, SORTOP=sort operator 
); 





SFUNC 状态 切换 函数 〈 这 个 名 称 不 够 直观 ， 此 处 所 谓 的 “状态 ”是 指 
在 聚合 运算 过 程 中 每 处 理 完 一 条 记录 后 得 到 的 中 间 结 果 ) 是 实现 聚 
合 运算 的 逻辑 主体 ， 它 会 将 自身 上 一 次 被 调用 后 生成 的 计算 结果 作 
为 本 次 计算 的 输入 ， 同 时 输入 的 还 有 当前 新 一 条 的 竺 处理 记录 ， 这 
样 将 所 有 记录 一 条 条 累积 处 理 完毕 后 ， 就 得 到 了 基于 整个 目标 记录 
集 的 “状态 ”>， 也 就 是 最 终 的 聚合 结果 。 有 的 情况 下 ，SFUNC 处 理 得 
到 的 结果 就 是 聚合 函数 需要 的 最 终结 果 ， 但 另外 一 些 情况 

下 ，SFUNC 处 理 完毕 的 结果 还 需要 再 进行 最 终 加 工 才 是 我 们 想 要 的 
聚合 结果 ，FINALFUNC 束 是 负 贡 这 个 最 终 加 工 步 又 的 函 




















数 。FINALFUNC 是 可 选 的 ， 由 于 它 的 作用 是 对 SFUNC 函数 的 输出 
结果 做 最 后 加 工 ， 因 此 它 的 输入 一 定 是 SFUNC 函数 的 输 

出 。INITCOND 也 是 可 选 的 ， 如 果 设 定 了 该 条 目 ， 那 么 其 值 会 被 作 
为 SFUNC 函数 的 “状态 ”的 初始 值 。 


最 后 的 SORTOP 也 是 可 选 的 ， 其 值 是 类 似 于 > 或 < 这 样 的 运算 符 ， 
它 的 作用 是 为 类 似 MAX 、MIN 这 样 的 排序 操作 指定 排序 运算 符 。 指 
定 了 SORTOP 运算 符 后 ， 规 划 器 会 使 用 索引 来 进行 MAX 、MIN 这 样 
的 聚合 运算 ， 由 于 索引 是 有 序 的 ， 所 以 可 以 快速 定位 到 索引 的 头 部 
或 者 尾部 以 寻找 MAX 、MIN 值 ， 这 样 就 不 需要 对 所 有 记录 逐条 进行 
大 小 值 判 断 ， 整 体 运 算 速 度 也 得 以 极 大 提升 。 不 过 SORTOP 运算 符 
的 使 用 有 一 个 先决 条 件 ， 那 就 是 在 聚合 运算 的 目标 表 上 ， 以 下 两 条 
语句 的 执行 结果 必须 完全 相同 。 


SELECT agg(col) FROM sometable; 
SELECT col FROM sometable ORDER BY col USING sortop LIMIT 1; 


和 在 PostgreSQL 9.4 中 ，CREATE AGGREGATE 语法 得 到 了 

强化 ， 新 增 了 对 移动 窗口 聚合 函数 的 支持， 该 特性 对 于 窗口 可 
移动 的 窗口 函数 是 很 有 意义 的 。 详 情 请 参考 9.4 版 官方 手册 中 
的 “创建 聚合 函数 "一 节 的 内 容 。 


























a 在 PostgreSQL 9.6 中 ， 聚 合 函 数 也 开始 文 持 并 行 执行 。 
通过 设置 函数 的 parallel 属性 来 指定 某 个 函数 是 否 启 用 并 
行 ， 具 体 可 以 设 为 safe 、unsafe 、restricted 这 几 个 值 。 
如 果 不 设 ， 默 认 是 unsafe 。 除 了 parallel 属性 ， 还 增加 了 
combinefunc 、serialfunc 和 deserialfunc 这 几 个 并 行 聚 
合 相 关 的 属性 。 详 情 请 参考 官方 手册 中 的 “SQL 创建 聚合 函 
数 ” 一 节 的 内 容 。 


一 般 来 说 ， 聚 合 函 数 只 针对 一 个 列 进 行 聚合 运算 ， 比 如 MAX 、MIN 
、AVG 等 ， 但 事实 上 完全 可 以 创建 针对 多 个 列 进行 聚合 运算 的 聚合 
疯 数 。 如 果 你 需要 这 样 的 多 列 聚 合 函 数 ， 请 参考 “How to Create 








Multi-Column Aggregates” 这 篇 博文 来 了 解 具 体 的 实现 方法 。 


前 面 已 经 介绍 过 聚合 函数 是 可 以 使 用 SQL 来 编写 的 。SQL 是 一 种 
极其 易 用 的 语言 ， 你 不 需要 关心 那些 各 式 各 样 的 流程 控制 语句 〈 因 
为 SQL 中 不 支持 ) ， 而 且 你 可 能 对 SQL 已 经 很 熟悉 ， 因 此 上 手 更 
加 简单 。 当 编写 聚合 函数 时 ， 仅 仅 使 用 SQL 就 可 以 实现 很 强大 的 
功能 。 我 们 将 在 8.2.2 节 中 介绍 相关 内 容 。 


8.1.4 受信 与 非 受 信 语 言 


PostgreSQL 文 持 的 函数 语言 可 按照 信任 级 别 分 为 两 类 : 受信 语言 与 
非 受 信 语 言 。 很 多 语言 (但 并 不 是 所 有 ) 同时 提供 了 受信 和 与 非 受信 
版 本 。 这 里 所 说 的 “受信 ?是 指 该 语言 不 可 能 对 数据 库 服务 器 的 底层 
操作 系统 造成 任何 破坏 ， 这 一 点 是 通过 拒绝 它 执 行 操作 系统 的 高 风 
念 操作 来 保证 的 。 简 要 介绍 如 下 。 

















受信 语言 


受信 语言 不 具备 直接 访问 数据 库 服 务 器 底层 文件 系统 的 权限 ， 
因此 在 该 类 语言 中 不 能 直接 执行 操作 系统 级 命令 。 任 何 权 限 级 别 的 
用 户 都 可 以 使 用 受信 语言 创建 疯 数 。 包 括 SQL、PL/pgSQL、 
PL/Perl 和 PL/V8 在 内 的 语言 都 是 受信 语言 。 




















非 受 信 语 言 


非 受信 语言 可 以 直接 与 操作 系统 进行 交互 ， 通 过 该 类 语言 可 以 
直接 调用 操作 系统 提供 的 函数 和 Web 服务 接口 。PostgreSQL 中 只 
有 超级 用 户 才 有 权 使 用 非 受信 语言 编写 函数 ， 但 超级 用 户 有 权 将 基 
于 非 受 信 语 言 的 函数 的 执行 权限 授予 普通 用 户 。 一 般 来 说 ， 非 受信 
语言 的 命名 会 以 U 结尾 ， 比 如 PL/PerllU、PL/PythonU 等 。 这 一 点 
并 不 绝对 ， 比 如 PL/R 就 是 个 例外 。 























01. 8.2 ”使 用 SQL 语言 来 编写 函数 


大 多 数 情 况 下 ， 我 们 仅仅 使 用 SQL 语言 来 编写 单个 语句 ， 但 事实 
上 它 也 可 以 用 于 编写 函数 。 在 PostgreSQL 中 ， 将 现 有 的 一 条 SQL 
语句 改造 为 图 数 是 一 件 又 快 又 简单 的 事情 : 只 需 在 现成 的 SQL 基 
础 上 加 上 函数 头 和 函数 尾 就 可 以 了 。 但 编写 简单 同时 也 意味 着 功能 
有 限 。SQL 不 是 一 种 过 程式 语言 ， 因 此 你 无 法 用 上 条 件 分 支 判 断 、 
循环 或 者 定义 变量 等 过 程式 语言 的 特性 。 此 外 还 有 一 个 更 严重 的 限 
制 ， 那 就 是 无 法 执行 使 用 函数 入 参 动 态 拼 装 的 SQL 语句 。 


当然 ，SQL 函数 也 有 其 优点 。 查 询 规 划 器 可 以 深入 到 SQL 函数 内 
部 ， 并 对 其 中 每 一 条 SQL 语句 进行 分 析 和 优化 ， 该 过 程 被 称 为 
inlining， 即 内 联 处 理 。 对 于 别 的 语言 编写 的 函数 ， 规 划 器 只 能 将 
其 当成 黑 盒 处 理 。 只 有 SQL 函数 可 以 被 内 联 处 理 ， 这 使 得 SQL 函 
数 能 够 充分 利用 索引 并 减少 重复 计算 。 


8.2.1 编写 基本 的 SQL 函 数 


示例 8-2 演示 了 一 个 最 基本 的 SQL 函数 ， 该 函数 回 表 中 插入 一 条 
记录 ， 并 返回 一 个 标量 值 。 


示例 8-2 ”创建 一 个 SQL 函数 ， 其 返回 值 为 新 插入 的 记录 的 
唯一 ID 

















CREATE OR REPLACE FUNCTION write to log(param user _ name varchar, 
param_ description text) 

RETURNS integer AS 

$$ 

INSERT INTO logs(user name, description) VALUES($1, $2) 


RETURNING log_id; 
$$ 
LANGUAGE 'sql' VOLATILE; 





函数 的 调用 语法 如 下 所 示 。 





SELECT write to log('alex', 'Logged in at 11:59 AM.') As new_ id; 


类 似 地 ， 也 可 以 在 SQL 函数 中 更 新 数据 并 返回 一 个 标量 或 者 不 返 
回 ， 如 示例 8-3 所 示 。 


示例 8-3 ”创建 一 个 进行 更 新 操作 的 SQL 函数 


CREATE OR _ REPLACE FUNCTION 

update logs(log id int, param user name varchar, param description tex 
RETURNS void AS 

$$ 

UPDATE logs SET user name = $2, description = $3 


， log ts = CURRENT_ TIMESTAMP WHERE log id = $1; 
$9$ 
LANGUAGE ‘sql' VOLATILE; 





通过 以 下 语句 来 调用 此 函数 。 


SELECT update logs(12, 'alex', 'Fell back asleep.'); 





基本 上 上 所 有 编程 语言 编写 的 函数 都 支持 返回 结果 集 ，SQL 函数 也 不 
例外 ， 它 有 三 种 返回 结果 和 集 的 方法 : 第 一 种 是 ANSI SQL 标准 中 规 
定 的 RETURNS TABLE 语法 ， 第 二 种 是 使 用 OUT 形 参 ， 第 三 种 是 使 
用 复合 数据 类 型 。 其 他 数据 库 一 般 也 都 是 基于 RETURNS TABLE 语 
法 来 实现 结果 集 的 返回 。 示 例 8-4 演示 了 如 何 使 用 这 三 种 方法 来 实 
现 返 回 结果 集 。 


示例 8-4 在 函数 中 返回 结果 集 
使 用 RETURNS TABLE 语法 的 方式 如 下 所 示 。 





CREATE OR REPLACE FUNCTION select logs rt(param user name varchar) 
RETURNS TABLE (log id int, user _ name varchar(56)， 
description text, log ts timestamptz) AS 


$$ 
SELECT log id, user name, description, log ts FROM logs WHERE user_nam 





$9$ 
LANGUAGE 'sql' STABLE PARALLEL SAFE; 





使 用 OUT 形 参 的 方式 如 下 所 示 。 


CREATE OR REPLACE FUNCTION select logs out(param user name varchar, OU 
， OUT user name varchar, OUT description text, OUT log ts timestamptz 

RETURNS SETOF record AS 

$$ 

SELECT * FROM logs WHERE user name = $1; 

$$ 

LANGUAGE ‘sql' STABLE PARALLEL SAFE; 








使 用 复合 数据 类 型 的 方式 如 下 所 示 。 


CREATE OR REPLACE FUNCTION select logs_ so(param user name varchar) 
RETURNS SETOF logs AS 

$$ 

SELECT * FROM logs WHERE user name = $1; 

$$ 

LANGUAGE 'sql' STABLE PARALLEL SAFE; 





以 上 三 种 方式 实现 的 函数 的 调用 方法 都 是 一 样 的 。 


SELECT * FROM select logs xxx('alex'); 








8.2.2 ”使 用 SQL 语言 编写 聚合 函数 


是 的 ! 你 没 看 错 ，PostgreSQL 支持 用 户 在 常见 的 MIN 、MAX 
、COUNT 、AVG 等 聚合 函数 之 外 上 自 定义 聚合 函数 。 本 市 将 演示 如 何 
使 用 SQL 语言 来 创建 一 个 用 于 计算 几何 平均 值 的 聚合 函数 。 几 何 
平均 值 是 指 nn 个 正 数 的 连 乘 积 的 n 次 方 根 ( (x1*x2*x3.. .xn) 
(1/n) ) ， 它 在 金融 、 经 济 以 及 统计 学 领域 有 着 广泛 的 应 用 。 当 样 








本 数字 的 值 域 范 围 变 化 很 大 时 ， 可 以 使 用 几何 平均 值 来 蔡 代 更 常见 
的 算术 平均 数 。 几 何平 均值 可 以 使 用 更 高 效 的 公式 来 计 

算 : EXP(SUM(LN(x))/n) ， 该 公式 使 用 了 对 数 来 将 连续 的 乘法 运 
算 转 换 为 连续 的 加 法 运算 ， 因 此 计算 机 执行 的 效率 更 高 。 在 下 面 的 
例子 中 ， 我 们 将 使 用 该 公式 计算 几何 平均 值 。 


为 了 构造 几何 平均 值 聚 合 郴 数 ， 需 要 创建 两 个 子 函 数 : 一 个 状态 转 
换 函 数 ， 用 于 把 对 数 运算 结果 相 加 (参见 示例 8-5) ; 一 个 最 终 处 
理 函 数 ， 用 于 对 对 数 之 和 进行 取款 运算 。 此 外 还 需要 指定 状态 初始 
值 为 0。 

示例 8-5 ”创建 几何 平均 值 聚合 函数 的 状态 切换 函数 


CREATE OR _ REPLACE FUNCTION geom_mean_state(prev numeric[2]，next numer 
RETURNS numeric[2] As 


WHEN $2 IS NULL OR $2 = 6 THEN $1 


ELSE ARRAY[COALESCE($1[1],6) + 1n($2), $1[2] + 1] 
END; 
$$ 
LANGUAGE sql IMMUTABLE PARALLEL SAFE; 





此 处 定义 的 状态 切换 函数 有 两 个 输入 项 : 第 一 个 是 前 次 调用 本 状态 
切换 函数 计算 后 得 到 的 结果 ， 其 类 型 为 含 两 个 元 素 的 数字 型 数组 ; 
第 二 个 是 本 轮 计 算 要 处 理 的 样本 值 。 如 果 第 二 个 参数 的 值 为 NULL 
或 者 为 0， 则 本 轮 无 须 计 算 ， 直 接 返回 参数 1 的 值 ; 否则 将 本 次 处 
理 的 样本 数字 的 In 对 数值 素 加 到 参数 数组 的 第 一 个 元 素 上 ， 并 对 
参数 数组 的 第 二 个 元 素 值 加 1。 这 样 最 终 得 到 结果 就 是 含 所 有 样本 
数字 的 In 对 数值 的 总 和 以 及 总 运算 次 数 。 


此 外 还 需要 一 个 如 示例 8-6 所 示 的 最 终 处 理 函 数 ， 该 函数 中 需要 将 
状态 转换 函数 计算 得 到 的 两 个 值 相 除 。 


示例 8-6 ”创建 儿 何平 均值 聚合 函数 的 最 终 处 理 函 数 


CREATE OR _ REPLACE FUNCTION geom mean final(numeric[2]) 





RETURNS numeric As 

$$ 

SELECT CASE WHEN $1[2] > © THEN exp($1[1]/$1[2]) ELSE ©@ END; 
$$ 

LANGUAGE sql IMMUTABLE PARALLEL SAFE; 





最 后 ， 需 要 将 前 面 定义 的 这 些 子 函数 整合 到 一 起 ， 组 成 一 个 完整 的 
聚合 函数 ， 语 法 如 示例 8-7 所 示 。〔 请 注意 ， 本 例 中 的 聚合 运算 需 
要 一 个 初始 值 (6,8) ， 该 初始 值 的 类 型 与 SFUNC 的 参数 类 型 一 定 
是 一 致 的 。) 


示例 8-7 ”基于 定义 好 的 子 函 数 来 创建 儿 何平 均值 从 合 函数 





CREATE AGGREGATE geom mean(numeric) ( 
SFUNC=geom mean_state, 
STYPE=numeric[ ]， 
FINALFUNC=geom_mean_final， 

PARALLEL = safe, 

INITCOND="' {6,06}' 

); 





接 下 来 测试 一 下 刚刚 创建 好 的 函数 。 在 示例 8-8 中 ， 我 们 计算 出 了 
0 0 


示例 8-8 ”基于 几何 平均 值 来 统计 出 种 族 多 样 性 最 好 的 5 个 县 





SELECT left(tract id,5) As county, geom mean(val) As div county 
FROM census.vw facts 

WHERE category = 'Population' AND short name != 'white alone 
GROUP BY county 

ORDER BY div county DESC LIMIT 5; 


county 


| 
4 
25625 | 85.1549646212833364 


25013 79.5972921427888918 
25817 74.76976097162419689 
25021 73.8824162664128504 


25627 | 73.5955649635237656 





接 下 来 我 们 步子 迈 大 一 点 ， 直 接 将 上 面 定 义 的 聚合 函数 当 作 窗口 函 
数 来 试 一 下 ， 看 效果 如 何 ， 如 示例 8-9 所 示 。 


示例 8-9 ” 列 出 5 个 种 族 多 样 性 最 好 的 人 口 普 但 区 





WITH X AS (SELECT 
tract_ id， 
left(tract id,5) As county, 
geom mean(val) OVER (PARTITION BY tract id) As div tract， 
ROW_ NUMBER() OVER (PARTITION BY tract id) As rn， 
geom mean(val) OVER(PARTITION BY left(tract id,5)) As div county 
FROM census.vw facts WHERE category = 'Population' AND short name != " 
) 
SELECT tract id, county, div tract, div county 
FROM X 
WHERE rn = 1 
ORDER BY div tract DESC, div county DESC LIMIT 5; 


tract _ id div_county 


25025160101 362.6815688785928786 .1549646212833364 
25027731966 265.6136982148147729 .5955649635237656 
250214162606 261.93516575609663296 .8824162664128564 
25025130466 2606.3241378371627137 .1549646212833364 
25017342506 257.4671462282588267 .76976097162419689 





01. 8.3 ”使 用 PLpgSQEL 语 言 编 写 函 数 
如 果 SQL 语言 已 经 不 能 满足 你 编写 图 数 的 需求 ， 一 般 来 说 销 见 的 
解决 方案 是 转 为 使 用 PL/ pgSQL。PL/pgSQL 优 于 SQL 的 地 方 在 
于 ， 它 支持 通过 DECLARE 语法 定义 本 地 变量 以 及 支持 流程 控制 语 
法 。 
8.3.1 ”编写 基础 的 PL/pgSQL 函 数 


为 了 展示 PL/pgSQL 与 SQL 的 语法 区 别 ， 我 们 在 示例 8-10 中 用 
PL/pgSQL 重 写 了 示例 8-4 中 的 函数 例子 。 


示例 8-10 ”使 用 PL/pgSQL 编写 返回 值 为 表 类 型 的 函数 


CREATE FUNCTION select_logs_rt(param_user_name varchar) 
RETURNS TABLE (log id int，user_name varchar(56)， 
description text, log ts timestamptz) AS 


RETURN QUERY 


SELECT log id, user name, description, log ts FROM logs 
WHERE user name = param user name; 


LANGUAGE “plLpgsql” STABLE; 





8.3.2 ”使 用 PL/pgSQL 编 写 触 发 器 函数 


由 于 PostgreSQL 不 文 持 使 用 SQL 编写 触发 器 函数 ， 因 此 
PL/pgSQL 惑 成 了 编写 触发 器 函数 的 首选 。 本 节 将 介绍 如 何 使 用 
PL/pgSQL 编写 基本 的 触发 器 函数 。 


总 共 需 要 两 个 步骤 : 第 一 步 是 写 一 个 触发 右 函 数 ， 第 二 步 是 将 此 触 
发 如 函数 显 式 附加 到 合适 的 触发 莫 上 。 第 二 步 将 处 理 触 及 莫 的 函数 
与 触发 器 本 身分 离开 ， 这 是 PostgreSQL 的 一 个 强大 的 功能 。 你 可 
以 将 同一 个 触发 大 函 数 附 加 到 多 个 触发 左上 ， 从 而 实现 触发 器 函数 











逻辑 的 重用 。 该 模式 是 PostgreSQL 的 独创 功能 ， 没 有 任何 别 的 数 
据 库 支持 该 特性 。 由 于 触发 器 函数 之 间 是 完全 独立 的 ， 你 可 以 为 每 
个 触发 器 函数 选择 不 同 的 编程 语言 ， 这 些 不 同 语言 编写 的 触发 器 完 
全 可 以 协同 工作 。PostgreSQL 支持 通过 一 个 触发 事件 (INSERT 
、UPDATE 、DELETE ) 激活 多 个 触发 右 ， 而 且 每 个 触发 堪 可 以 基于 
不 同 的 语言 编写。 例如 ， 假 设 数据 库 中 发 生 某 一 事件 时 你 需要 将 其 
记录 下 来 ， 另 外 还 需要 发 邮件 通知 你 。 那 么 你 可 以 使 用 
PL/PythonU 或 者 PL/ PerlU 语言 编写 一 个 具备 发 送 邮 件 功能 的 触发 
器 ; 同时 可 以 使 用 PL/pgSQL 语言 编写 一 个 记录 日 志 的 触发 器 。 砾 
生 指 定 事 件 时 ， 这 两 个 触发 器 会 同时 被 触发 ， 执 行 各 自 的 任务 。 


示例 8-11 中 演示 了 如 何 创建 一 个 基本 的 触发 右 函 数 及 配套 的 触发 
器 。 











人 8-11 ”通过 触及 圳 对 新 插入 的 记录 或 者 修改 的 记录 打 时 
间 戳 


CREATE OR _ REPLACE FUNCTION trig time stamper() RETURNS trigger AS © 


NEN.upd ts := CURRENT_TIMESTAMP; 
RETURN NEW 


LANGUAGE plpgsql VOLATILE; 


CREATE TRIGGER trig 1 

BEFORE INSERT OR UPDATE OF session state, session id @ 
ON web_ sessions 

FOR EACH RON EXECUTE PROCEDURE trig time stamper(); 





@ 定义 触发 器 函数 。 该 函数 适用 于 任何 带 有 upd_ts 字段 的 表 。 该 
2 upd_ts 字段 的 值 更 新 为 当前 时 间 惟 ， 然 后 再 返回 修改 
百 的 记录 。 


@ “字段 级 触发 "是 9.0 版 开始 支持 的 一 个 特性 ， 通 过 该 特性 可 以 将 
触发 器 的 触发 时 机 精确 到 字段 级 别 。 在 9.0 版 之 前 ， 只 要 发 生 了 
UPDATE 或 者 INSERT 动作 ， 上 面 示例 中 的 触发 器 都 会 被 触发 。 
此 ， 如 果 要 实现 字段 级 触发 控制 ， 就 必须 拿 OLD .some_column 和 


NEW. some_column 进行 对 比 ， 找 到 发 生变 化 的 字段 ， 然 后 才能 判 
人 (请 注意 : INSTEAD OF 触发 器 不 支 
持 该 特性 。 


01. 8.4 使 用 PL/Python 语 言 编 写 函 数 


Python 是 一 种 非 浓 灵活 的 语言 ， 它 文 持 非 稼 丰富 的 功能 扩展 库 。 据 
我 们 所 知 ，PostgreSQL 是 唯一 一 种 允许 用 户 使 用 Python 语言 来 编 
写 函 数 的 数据 库 。 从 9.0 版 开始 ，PostgreSQL 还 同时 支持 了 Python 
2 和 Python 3 两 种 语言 。 








从 、 你 可 以 在 同一 个 database 中 同时 安装 PL/Python2U 和 
PL/Python3U 这 两 个 语言 包 ， 但 在 同一 个 用 户 会 话 上 不 能 同时 
使 用 这 两 种 语言 。 这 就 意味 着 你 不 能 在 同一 个 语句 中 同时 调用 
分 别 由 PL/Python2U 和 PL/Python3U 编写 的 函数 。 你 在 系统 中 
会 见 到 一 种 叫 作 PL/PythonU 的 语言 ， 它 实际 上 是 系统 为 了 保 
持 前 向 兼容 而 为 PL/Python2U 语言 创建 的 一 个 别名 。 


在 使 用 PL/Python 语言 之 前 ， 要 先 在 服务 器 上 搭建 好 Python 运行 环 
境 。Windows 和 Mac 平台 的 Python 安装 包 可 以 从 
http://www.python.org/download/ 站 点 下 载 。Linux/Unix 平台 的 各 种 
发 行 版 上 一 般 都 已 经 附带 了 Python 环境 ， 因 此 无 须 额 外 安装 。 请 
参考 PostgreSQL 官方 手册 中 对 PL/Python 的 相关 介绍 来 了 解 详情 。 
搭建 好 Python 运行 环境 之 后 ， 需 要 为 PostgreSQL 安装 Python 语言 
扩展 包 。 











CREATE EXTENSION plpython2u; 
CREATE EXTENSION plpython3u; 


在 PostgreSQL 上 安装 Python 语言 扩展 包 之 前 ， 务 必 人 确保 服务 器 操 
作 系 统 上 的 Python 运行 环境 已 经 正常 ， 否 则 你 可 能 会 过 到 各 种 奇 








奇怪 怪 的 问题 。 


由 于 PostgreSQL 的 PL/PythonU 语言 扩展 包 是 基于 某 个 具体 版 本 的 
Python 语言 包 编 译 出 来 的 ， 因 此 你 需要 保证 服务 器 上 的 Python 版 
本 与 plpythonu 扩展 包 的 版 本 是 匹配 的 。 例 如 ， 假 设 你 的 
plpython2u 扩展 包 是 基于 Python 2.7 编译 的 ， 那 么 服务 器 上 就 需 
要 安装 好 Python 2.7 运行 环境 。 











编写 基本 的 Python 函数 


PostgreSQL 会 自动 在 PostgreSQL 数据 类 型 与 Python 数据 类 型 间 进 
行 双 回转 换 。PL/Python 语言 编写 的 函数 文 持 返 回 数组 和 复合 数据 
类 型 。 你 可 以 使 用 PL/Python 来 编写 触发 器 函数 和 聚合 函数 。 我 们 
在 PostgresOnline 站 点 上 提供 了 一 系列 介绍 PL/Python 的 文章 ， 其 
中 有 相关 的 语法 示例 。 


Python 语言 可 以 实现 一 些 通过 PL/pgSQL 语言 无 法 实现 的 功能 。 示 
例 8-12 中 演示 了 如 何 使 用 PL/Python 语言 来 编写 一 个 文本 搜索 函 
数 ， 该 函数 可 以 实现 对 PostgreSQL 在 线 官方 手册 的 内 容 进 行 检 


示例 8-12 ”使 用 PL/Python 语言 编写 的 函数 来 搜索 
PostgreSQL 官方 手册 的 内 容 





CREATE OR _ REPLACE FUNCTION postgresql help search(param search text) 

RETURNS text AS 

$$ 

import urllib, re © 

response = urllib.urlopen( 

"http://www.postgresql.org/search/?u=%2Fdocs%2Fcurrent%2F&q=" + pa 

) © 

raw_html = response.read() © 

result = 
raw_html[raw_html.find("<!-- docbot goes here -->") : 
raw_html.find("<!-- pgContentWrap -->") - 1] @ 

result = re.sub('<[^<]+?>', '', result).strip() © 

return result @ 

$$ 

LANGUAGE plpython2u SECURITY DEFINER STABLE; 











@ 导入 接 下 来 需要 使 用 的 功能 
@ 在 连接 搜索 词 之 后 执行 搜索 。 
读 取 人 返回 的 搜索 结果 并 将 其 保存 到 一 个 名 为 raw_html 的 变量 


四 从 raw_html 中 将 <!-- docbot goes here -> 和 <!-- 
pgContentWrap --> 之 间 包 含 的 内 容 和 截取 出 来 ， 并 存放 到 一 个 名 
为 result 的 新 变量 中 。 

@ 将 result 开头 和 结尾 的 HTML 标记 和 空格 删除 。 

@ 返回 result 变量 的 内 容 。 


调用 Python 函数 与 调用 别 的 语言 编写 的 函数 没什么 两 样 。 在 示例 
8-13 中 ， 我 们 使 用 在 示例 8-12 中 创建 的 函数 来 搜索 三 个 字符 串 。 


示例 8-13 ”在 查询 语句 中 使 用 Python 函数 





SELECT search term, left(postgresql help search(search term),125) As r 
FROM (VALUES ('regexp match'),('pg trgm'),('tsvector')) As x(search te 





前 面 提 到 过 ，PL/Python 是 一 种 非 受 信 语 言 ， 而 且 没 有 相应 的 受信 
版 本 。 这 意味 着 只 有 超级 用 户 才 能 使 用 PL/Python 编写 函数 ， 并 且 
使 用 该 语言 编写 出 来 的 函数 可 以 直接 操作 文件 系统 。 示 例 8-14 惑 

利用 了 PL/Python 的 这 种 能 力 来 获得 一 个 目录 中 的 文件 列表 。 请 注 
意 ， 从 操作 系统 的 角度 来 看 ，PL/Python 函数 是 以 PostgreSQL 安装 
时 创建 的 postgres 操作 系统 账户 喘 份 来 执行 的 ， 因 此 你 在 执行 该 
0 postgres 账户 对 该 示例 中 使 用 的 目录 拥有 访问 
又 限 。 


示例 8-14 ” 列 出 一 个 目录 中 的 所 有 文件 





CREATE OR REPLACE FUNCTION list incoming files() 
RETURNS SETOF text AS 
$$ 


import os 


return os.listdir('/incoming') 
$$ 
LANGUAGE ‘plpython2u' VOLATILE SECURITY DEFINER; 





可 以 通过 以 下 语句 执行 上 面 创建 的 函数 。 


SELECT filename 
FROM list incoming files() As filename 


WHERE filename ILIKE '%.csv' 





01. 8.5 ”使 用 PL/V8、PL/CoffeeScript 以 及 

PL/LiveScript 语 言 来 编写 消 数 

PL/V8《〈 又 名 PL/JavaScript) 是 一 种 基于 Google V8 引擎 的 受信 语 
言 。 通 过 它 可 以 用 JavaScript 来 编写 函数 ， 并 使 用 JSON 数据 类 型 
来 与 外 界 交 互 。PL/V8 并 不 是 PostgreSQL 的 一 个 核心 功能 ， 因 此 
在 比较 流行 的 PostgreSQL 发 行 版 中 都 不 附带 此 语言 包 。 你 可 以 通 
过 源码 自行 编译 安装 。 我 们 已 经 为 你 提供 了 编译 好 的 Windows 平 
台 安 装 包 。 你 可 以 从 PostgresOnline 站 点 下 载 到 PostgreSQL 9.6 版 
本 的 PL/V8 安装 包 ( 含 32 位 和 64 位 版 本 ) 。 


在 PostgreSQL 中 安装 了 PL/V8 扩展 包 后 ， 你 会 发 现 新 增 文 持 的 语 
言 不 是 一 种 ， 而 是 三 种 ， 不 过 它们 都 是 JavaScript 的 相关 语言 。 


PL/V8 (plv8) 
这 是 最 基本 的 JavaScript 语言 ， 也 是 下 面 两 种 语言 的 基础 。 


PL/CoffeeScript (plcoffee) 





CoffeeScript 是 一 门 简 洁 的 、 构 架 于 JavaScript 之 上 的 预 处 理 器 
语言 ， 可 以 静态 编译 成 JavaScript。 其 语法 类 似 于 Python， 也 使 用 
了 缩 进 格 式 来 表达 代码 段 之 间 的 隶属 关系 ， 从 而 省 挥 了 烦人 的 大 括 
写 。 


PL/LiveScript (plls) 


LiveScript 是 CoffeeScript 语言 的 一 个 分 文 ， 其 语法 与 
CoffeeScript 类 似 ， 但 拥有 更 多 的 语法 特性 。“CoffeeScript: 10 
Reasons to Switch from CoffeeScript to LiveScript” 这 篇 文章 中 认为 
LiveScript 是 CoffeeScript 的 理想 替代 品 。 相 比 CoffeeScript， 
LiveScript 拥有 更 多 类 似 于 Python、EF# 和 Haskell 的 特性 。 如 果 你 
正在 寻找 一 门 比 PL/Python 占用 内 存 空 间 更 小 的 受信 语言 ， 那 么 应 
该 试 试 LiveScript。 





PL/CoffeeScript 和 PL/LiveScript 语言 都 是 基于 相同 版 本 的 PL/V8 库 


编译 的 ， 因 此 二 者 的 功能 本 质 上 与 PL/V8 完全 一 致 。 事 实 上 ， 如 果 
这 两 种 语言 你 试用 之 后 觉得 不 合适 ， 那 么 也 可 以 很 轻易 地 切换 回 
PL/V8。 这 三 种 语言 都 是 受信 语言 ， 这 意味 着 它们 无 法 访问 底层 文 
件 系 统 ， 但 没有 超级 用 户 权 限 的 用 户 可 以 用 它们 来 实现 函数 。 
示例 8-15 中 是 创建 这 三 个 语言 包 的 命令 。 如 果 你 需要 在 某 个 
database 中 使 用 这 些 语言 ， 那 么 就 必须 在 其 中 执行 一 遍 这 些 安装 命 
令 。 这 三 种 语言 可 以 单独 按 需 安装 。 


示例 8-15 PL/V8 系列 语言 包 的 安装 




















CREATE EXTENSION plv8; 
CREATE EXTENSION plcoffee; 


CREATE EXTENSION plls; 





与 PL/pgSQL 相 比 ， 上 述 的 PL/V8 系列 语言 能 够 提供 很 多 关键 的 功 
能 特性 ， 这 使 得 它们 有 着 独特 的 存在 价值 。 这 些 特性 中 的 一 部 分 只 
有 PL/R 这 种 高 端 过 程式 语言 才 支持 。 


。 与 SQL 和 PL/pgSQL 相 比 ， 数 学 运算 速度 更 快 。 

。 创建 窗口 函数 的 能 力 。SQL、PLpgSQL、PL/Python 均 不 支持 
该 能 力 (但 PL/R 和 C 语言 是 支持 的 ) 。 

创建 触发 器 函数 和 聚合 函数 的 能 力 。 

人 子 事务 、 内 瞬 函 数 、 类 以 及 try-catch 异常 处 
理 机 制 |。 

使 用 eval 函数 动态 执行 JavaScript 代码 的 能 力 。 

支持 JSON 数据 类 型 ， 能 对 JSON 对 象 进行 循环 科 选 处 理 。 

在 D0 命令 的 匿名 代码 块 中 访问 函数 的 能 力 。 

兼容 Node.js。PL/V8 和 Node.js 均 使 用 了 谷歌 V8 引擎 ， 因 此 
很 多 适用 于 Node.js 的 库 可 以 不 经 修改 就 直接 应 用 于 PL/V8。 
这 给 Node.js 开发 人 员 以 及 其 他 使 用 JavaScript 进行 网 络 应 用 
开发 的 人 们 带 来 了 很 多 便利 。PostgreSQL 中 有 一 个 名 为 plv8x 
站 展 包 ， 它 使 得 Node.js 的 库 在 PL/V8 中 重用 起 来 更 加 容 


PostgresOnline 博客 站 点 上 提供 了 一 些 介绍 PL/V8 用 法 的 例子 。 在 











有 的 例子 里 ， 我 们 从 网 上 找 来 了 大 块 的 JavaScript 代码 并 修改 移植 
为 PL/V8 语言 ， 详 情 可 参考 “Using PLV8 to Build JSON Selectors” 这 
篇 博文 。 前 述 PL/V8 系列 语言 可 完美 地 辅助 Web 应 用 开发 ， 因 为 
大 量 的 客户 端 JavaScript 代码 都 是 可 以 直接 拿 来 重用 的 。 不 过 ， 对 
于 PostgreSQL 来 说 ， 这 几 种 语言 更 为 重要 的 意义 在 于 它们 都 是 全 
言 ， 可 用 于 处 理 数 值 计 算 、 数 据 修改 以 及 很 多 其 他 任 











8.5.1 编写 基本 的 函数 


PL/V8 语言 的 主要 优点 之 一 束 是 可 以 在 PL/V8 函数 中 直接 调用 任何 
JavaScript 函数 ， 而 且 几 乎 不 需要 做 修改 。 例 如 ， 网 上 有 很 多 对 电 
子 邮件 地 址 进行 合法 性 验证 的 JavaScript 函数 ， 我 们 随便 找 了 一 个 
并 将 其 封装 为 PL/V8 函数 ， 如 示例 8-16 所 示 。 


示例 8-16 ”使 用 PL/V8 函数 来 验证 电子 邮件 地 址 的 合法 性 








CREATE OR _ REPLACE _ FUNCTION 

validate email(email text) returns boolean as 
$$ 

var re = /\S+@\S+\.\S+/; 


return re.test(email); 
$$ LANGUAGE plv8 IMMUTABLE STRICT PARALLEL SAFE; 





上 面 的 例子 中 使 用 了 一 个 JavaScript 正则 表达 式 对 象 来 检查 电子 邮 
件 地 址 的 合法 性 。 示 例 8-17 中 演示 了 如 何 使 用 此 函数 。 


示例 8-17 调用 PL/V8 语言 编写 的 电子 邮件 地 址 合法 性 校 验 
函数 


SELECT email, validate email(email) ASs is valid 
FROM (VALUES ('alexgomezq@gmail.com') 


,('alexgomezqgmail.com'),('alexgomezq@gmailcom')) As x (email); 





输出 结果 如 下 : 


alexgomezq@gmail .com 


alexgomezqgmail.com 
alexgomezq@gmailcom 





虽然 可 以 使 用 PL/pgSQL 语言 以 及 PostgreSQL 自己 的 正则 表达 式 
功能 来 实现 与 上 例 中 完全 相同 的 验证 功能 ， 但 我 们 刚刚 还 是 光明 正 
大 地 拿 来 了 一 段 别 人 的 成 熟 代 码 ， 然 后 没 花 任 何 时 间 就 实现 了 预期 
的 功能 。 对 开发 人 员 来 说 ， 这 难道 不 是 最 理想 的 人 生体 验 吗 ? 如 果 
你 是 一 名 Web 开发 人 员 ， 而 且 需 要 在 客户 端 和 数据 库 服务 器 端 同 
时 对 某 份 数据 进行 逻辑 完全 相同 的 合法 性 验证 ， 那 么 使 用 PL/V8 可 
以 使 你 的 工作 事半功倍 ， 只 要 在 客户 端 写 好 逻辑 ， 然 后 复制 粘贴 到 
数据 库 端 就 可 以 了 。 


你 可 以 创建 一 张 带 一 个 text 字段 的 表 〈 该 text 字段 用 于 存储 
JavaScript 函数 ) ， 然 后 将 这 些 校 验 函 数 都 存 入 该 表 。 然 后 通过 一 
些 设置 ， 可 以 实现 PostgreSQL 启动 时 自动 加 载 表 中 存储 的 这 些 函 
数 ， 此 后 在 数据 库 的 任何 PL/V8 函数 中 都 可 以 随便 调用 这 些 函 数 
了 。 具 体 的 操作 步 又 请 参考 Andrew Dunstan 的 博文 “Loading Useful 
Modules in PLV8”。 能 够 实现 JavaScript 函数 自动 加 载 的 关键 在 

于 ，PL/V8 原生 文 持 了 eval 函数 ， 通 过 该 函数 可 以 动态 执行 任何 
JavaScript 命令 ， 因 此 才 得 以 在 启动 阶段 就 对 函数 进行 预 加 载 。 

我 们 通过 一 个 在 线 语法 转换 器 (js2coffee.org) 将 示例 8-17 中 的 
JavaScript 函数 转换 成 了 基于 CoffeeScript 语法 的 函数 ， 如 示例 8-18 
所 示 。 


示例 8-18 ”使 用 PL/Coffee 语言 编写 的 电子 邮件 地 址 校 验 函 数 

















CREATE OR _ REPLACE FUNCTION 
validate email(email text) returns boolean as 


$$ 


re = /\S+@\S+\.\S+/ 
return re.test email 
$$ 
LANGUAGE plcoffee IMMUTABLE STRICT PARALLEL SAFE; 


| | 


CoffeeScript 与 JavaScript 之 间 的 语法 差别 并 不 大 ， 主 要 的 变化 是 去 
掉 了 小 括号 、 大 括号 和 分 号 。LiveScript 的 语法 和 CoffeeScript 的 语 
法 几乎 完全 一 样 ， 唯 一 的 差别 就 是 语言 声明 要 改 为 LANGUAGE 

plls 。 


8.5.2 ”使 用 PL/V8 来 编写 聚合 函数 

在 示例 8-19 和 示例 8-20 中 ， 我 们 使 用 PL/V8 语言 重 写 了 计算 几何 
人 ( 原 例子 
请 参考 8.2.2 节 ) 。 


示例 8-19 ”PL/V8 版 的 几何 平均 值 聚 合 困 数 的 状态 切换 函数 








CREATE OR _ REPLACE FUNCTION geom_mean_state(prev numeric[2]，next numer 
RETURNS numeric[2] As 
$$ 


return (next == null || next== 6) ? prev : 


[(prev[6] == null)? 8: prev[6] + Math.log(next), prev[1] + 1]; 
$$ 
LANGUAGE plv8 IMMUTABLE PARALLEL SAFE; 





示例 8-20 ”PL/V8 版 的 几何 平均 值 聚 合 图 数 的 最 终 处 理 函 数 


CREATE OR _ REPLACE FUNCTION geom_mean_final(in_num numeric[2]) 
RETURNS numeric AS 
$$ 


return in num[1] > 6 »? Math.exp(in num[8]/in num[1]) : ©; 


$9$ 
LANGUAGE plv8 IMMUTABLE PARALLEL SAFE; 





最 后 ，CREATE AGGREGATE 命令 将 各 子 函数 整合 成 我 们 想 要 的 聚合 
函数 。 不 管子 函数 采用 什么 语言 编写， 此 处 的 语法 都 是 一 样 的 ， 具 
体 如 示例 8-21 所 示 。 


示例 8-21 PL/V8 版 的 几何 平均 值 聚 合 函 数 的 最 终 定义 








CREATE AGGREGATE geom mean(numeric) ( 
SFUNC=geom mean_state, 
STYPE=numeric[ ]， 
FINALFUNC=geom mean_ final, 

PARALLEL = safe, 


INITCOND="' {60,0}" 





你 可 以 再 运行 一 过 示例 8-9， 但 把 其 中 的 geom_mean 函数 换 为 此 处 
的 PL/V8 版 本 。 得 到 的 结果 与 当初 使 用 SQL 版 本 geom_mean 计算 
得 到 的 结果 肯定 是 一 样 的 ， 但 PL/V8 版 本 的 运算 速度 比 SQL 版 本 
要 快 两 到 三 倍 。 对 于 数学 运算 来 说 ， 你 会 发 现在 很 多 情况 下 ， 用 
， 语言 编写 的 函数 要 比 用 SQL 编写 的 功能 相同 的 函数 快 10 到 
20 倍 。 














8.5.3 ”使 用 PLMV8 编 写 窗口 函数 


PostgreSQL 有 很 多 内 置 的 窗口 函数 ，7.3 节 中 已 讨论 过 。 任 何 一 个 
聚合 函数 ， 包 括 用 户 自 定义 的 聚合 函数 ， 都 可 以 用 作 窗 口 聚 合 函 
数 。 仅 这 两 个 功能 点 已 足以 使 PostgreSQL 在 所 有 的 关系 型 数据 库 
中 脱 锋 而 出 。 更 加 令 人 印象 深刻 的 是 ，PostgreSQL 还 文 持 用 户 自 定 
义 窗口 函数 。 


不 过 请 注意 ，PostgreSQL 所 支持 的 大 多 数 过 程式 语言 都 不 能 用 于 创 
建 窗口 函数 。 不 管 是 内 置 的 PL/pgSQL 还 是 SQL， 抑 或 是 
PL/Python 和 PL/Perl 都 不 文 持 该 特性 。C 语言 可 以 ， 但 需要 编译 ， 
这 很 碎 烦 。PL/R 部 分 支持 该 特性 ， 但 PL/V8 不 但 完全 支持 创建 自 
定义 窗口 函数 ， 而 且 速 度 还 很 快 〈 在 很 多 情况 下 速度 与 用 C 编写 是 
一 样 的) ， 另 外 它 还 不 需要 像 C 一 样 对 函数 代码 编译 后 才能 


PL/V8 语言 支持 一 个 名 为 plv8.window_object 的 函数 ， 该 函数 
可 以 返回 当前 窗口 对 象 的 一 个 句柄 ， 通 过 该 句柄 可 以 对 窗口 内 的 元 
素 进行 检视 和 访问 。 正 是 由 于 该 特性 的 存在 ，PL/V8 才 可 以 文 持 创 
建 自 定义 窗口 函数 。 


在 示例 8-22 中 ， 我 们 创建 了 一 个 窗口 函数 ， 其 功能 是 对 于 表 中 每 
一 行 ， 判 定 它 是 侣 是 一 批 * 连 续 值 记录 ”中 的 首 记 录 ， 如 果 是 就 返回 





























true， 人 否则 返回 false。 此 处 , “连续 值 记 录 ” 的 判定 标准 是 从 该 记录 
开始 连续 N 条 记录 的 特定 字段 值 部 相 同 。 该 函数 可 以 让 用 户 上 自行 
设 定 连续 多 少 条 记录 值 相同 就 算是 “连续 值 记录 ”，ofs 参数 用 于 设 
定 该 值 。 


示例 8-22 ”用 PL/V8 创建 的 窗口 函数 来 标记 重复 记录 值 





CREATE FUNCTION run_begin(arg anyelement, ofs int) RETURNS boolean AS 
var winobj = plv8.get window object() 
var result = true; 
/** 获取 当前 值 **/ 
var cval = winobj.get func arg in partition(©, 
6， 
winobj.SEEK_ CURRENT, 
false); 
(i = 1; i «< ofs; i++){ 
/** 获取 下 一 个 值 **/ 
nval = winobj.get func arg in partition(@, 
i, 
winobj .SEEK_ CURRENT, 
false); 
result = (cval == nval) ? true : false; 
if (!result)t{ 
break; 


} 
/** 下 一 个 当前 值 是 最 后 一 个 值 **/ 


cval = nval; 


} 
return result; 
$$ LANGUAGE plv8 WINDOW; 





要 将 一 个 函数 定义 为 窗口 函数 ， 必 须 在 其 末尾 行 加 上 WINDOWS 标 
记 符 ， 如 示例 8-22 所 示 。 


在 函数 的 主体 逻辑 中 ， 必 须要 遍历 访问 窗口 中 的 每 条 记录 并 对 其 进 
行 计 算 和 判定 。 如 前 所 述 ，PL/V8 支持 通过 窗口 句柄 来 实现 这 一 功 
能 ， 该 句柄 支持 的 所 有 API 可 在 PL/V8 官方 手册 的 “PL/V8 窗口 函 
数 AP 一 节 中 查 到 。 我 们 在 上 面 所 编写 的 函数 中 会 透 过 窗口 查看 
当前 记录 的 后 ofs 条 记录 的 值 。 如 果 后 ofs 条 记录 的 值 与 当前 记 
录 的 值 都 一 样 ， 则 说 明 当 前 记录 是 一 批 “ 连 续 值 记录 ”的 首 记 录 ， 窗 














口 函 数 返 回 true， 否 则 返回 false。PL/V8 提供 了 
get_func_arg_in_partiton 疯 数 以 扫描 窗口 中 的 记录 。 我 们 通 
过 该 函数 查看 该 记录 的 后 续 记 录 ， 当 判定 到 后 续 记 录 的 值 与 当前 记 
录 值 不 同 或 者 已 到 达 最 后 一 条 记录 时 ， 则 返回 false 并 退出 。 


我 们 使 用 该 函数 来 判定 掷 硬币 游戏 的 局 家 。 每 个 玩家 投 四 次 硬币 ， 
如 末 连 续 三 次 都 掷 出 头像 面 则 算 局 ， 如 示例 8-23 所 示 。 


示例 8-23 ”PL/V8 窗口 函数 的 使 用 

















SELECT id, player, toss, 
run_begin(toss,3) OVER (PARTITION BY player ORDER BY id) AS rb 
FROM coin tosses 
BY player, id; 


regina 
regina 
regina 
regina 
sonia 
sonia 
sonia 
sonia 
ows) 


| 
| 
| 


二 | 二 二 二 二 二 工 工 二 工 工 二 工 工 工 工 
十 十 直路 赴 相让 直 十 让 让 十 十 十 寺 叶 








如 需 更 多 使 用 PL/V8 编写 的 函数 示例 ， 请 从 GitHub 上 的 “window 
regression script” 项 目下 载 。 其 中 演示 了 如 何 使 用 PL/V8 创建 
PostgreSQL 内 置 的 窗口 函数 〈 包 括 lead 、1ag 、row_number 
、Cume dist 、first value 、last _ value 等 ) 。 


01. 


第 9 章 查询 性 能 调 优 


我 们 在 使 用 数据 库 的 过 程 中 述 早 会 遇 到 语句 性 能 问题 ， 常 见 的 解决 
方案 是 优化 SQL 语句 本 身 的 写法 ， 辅 以 建立 合适 的 索引 以 及 更 新 
规划 器 分 析 过 程 中 所 需 的 统计 信息 。 为 了 帮助 用 户 实现 这 些 优化 动 
作 ，PostgreSQL 提供 了 内 置 的 执行 计划 解释 器 ， 通 过 它 可 以 展示 出 
一 个 SQL 语句 的 执行 计划 。 如 果 你 了 解 如 何 编 写 正 确 的 SQL 语 
多、 如 何 建 立 合 适 的 索引 ， 以 及 执行 计划 解释 器 的 帮助 ， 那 么 写 出 
优秀 的 SQL 语句 并 充分 利用 硬件 的 最 大 计算 能 力 应 该 不 是 难事 。 





01. 9.1 通过 EXPLAIN 命令 查看 语句 执行 计划 


要 定位 语句 的 性 能 问题 ， 最 简单 直接 的 方法 就 是 使 用 EXPLAIN 和 
EXPLAIN (ANALYZE) 命令 来 分 析 其 执行 计划 。PostgreSQL 从 很 早 
的 版 本 开始 就 已 经 文 持 该 命令 ， 并 且 历 年 来 其 功能 一 直 在 不 断 地 演 
进 ， 目 前 已 经 非常 成 熟 ， 可 以 展示 出 一 个 语句 的 执行 计划 方方面面 
的 细节 。 在 演进 过 程 中 ， 该 命令 文 持 的 输出 格式 也 越 来 越 丰 

富 。EXPLAIN 命令 甚至 文 持 将 输出 转 储 为 XML、JSON 或 者 
YAML 格式 。 


对 于 普通 用 户 来 说 ， 该 功能 最 令 人 激动 的 一 次 强化 是 几 年 前 
pgAdmin 引入 的 图 形 化 展示 执行 计划 的 能 力 。 借 助 这 种 能 力 ， 你 只 
再 仔细 观察 执行 计划 图 ， 即 可 了 解 语句 的 瓶颈 点 在 哪里 ， 哪 些 表 应 
该 建 索 引 ， 以 及 实际 的 执行 路 径 与 预期 的 执行 路 径 是 售 一 致 。 














9.1.1 ”EXPLAIN 选项 


要 执行 非 图 形 化 的 EXPLAIN 分 析 ， 只 需 在 SQL 语句 前 加 上 
EXPLAIN 以 及 一 些 可 选 参数 ， 然 后 再 执行 即 可 。 


。 本 号 的 执行 效果 是 输出 执行 计划 而 并 不 执行 SQL 语 





加 上 ANALYZE 参数 之 后 〈 就 像 EXPLAIN (ANALYZE) ) 的 执行 
效果 是 执行 该 SQL 语句 本 身 ， 而 且 会 将 实际 执行 情况 与 执行 
计划 进行 对 比分 析 ， 这 可 以 用 来 评估 执行 计划 的 准确 性 。 

在 EXPLAIN 后 增加 VERBOSE 参数 (语法 是 EXPLAIN 
(VERBOSE) ) 将 使 得 输出 的 执行 计划 步骤 精确 到 列 级 别 。 

还 有 一 个 必须 与 ANALYZE 参数 联 用 的 BUFFERS 参数 ， 其 语法 
为 EXPLAIN (ANALYZE，BUFFERS) ， 通 过 它 可 以 显示 出 执行 
计划 过 程 中 重用 绥 存 数据 时 的 命中 次 数 ， 这 个 数字 越 大 就 表示 
本 次 查询 过 程 中 从 内 存 缓存 中 获取 的 记录 数 越 多 ， 这 些 数据 是 
之 前 的 查询 执行 过 程 中 缓存 下 来 的 ， 绥 存 中 己 有 的 数据 块 承 不 
需要 再 从 磁盘 读 取 了 。 


完整 的 SQL 语句 执行 计划 解释 语法 是 这 样 的 : EXPLAIN 
(ANALYZE，VERBOSE，BUFFERS) + 查询 语句 ， 执 行 后 输出 的 结果 











包括 执行 时 间 、 列 的 输出 以 及 缓存 命中 次 数 等 。 

对 于 UPDATE 或 者 INSERT 这 种 DML 语句 来 说 ， 如 果 仅 希望 查看 
其 通过 EXPLAIN (ANALYZE) 得 到 的 执行 计划 而 并 不 希望 真正 执行 
数据 修改 ， 可 以 把 这 个 语句 包装 成 一 个 事务 块 ， 即 语句 之 前 加 
BEGIN ， 之 后 加 ROLLBACK 。 

可 以 通过 pgAdmin 这 种 图 形 化 工具 来 实现 图 形 化 的 EXPLAIN 。 启 
动 pgAdmin 之 后 ， 请 像 平常 一 样 编写 好 查询 语句 ， 但 不 要 执行 
它 ， 然 后 从 下 拉 菜 单 中 选择 EXPLAIN 或 者 EXPLAIN (ANALYZE) 。 


9.1.2 运行 示例 以 及 输出 内 容 解 释 


我 们 找 个 例子 来 试验 一 下 。 首 先 使 用 EXPLAIN (ANALYZE) 命令 ， 
SQL 命令 中 使 用 的 是 示例 4-1 和 示例 4-2 中 创建 的 表 。 


我 们 想 先 测试 语句 不 使 用 索引 的 情况 ， 因 此 先 将 表 上 的 主键 市 挥 。 


ALTER TABLE census.hisp pop DROP CONSTRAINT IF EXISTS hisp pop_pkey; 


删除 表 上 所 有 的 索引 后 ， 我 们 可 以 看 到 此 时 使 用 了 最 基础 的 执行 计 
划 ， 即 全 表 扫 摘 集 略 。 如 示例 9-1 所 示 。 


9-1 ”使 用 EXPLAIN (ANALYZE) 查看 全 表 扫 描 的 执行 计 
| 











EXPLAIN (ANALYZE) 
SELECT tract id, hispanic or latino 
FROM census.hisp pop 


WHERE tract id = '2506256106103'; 





如 果 仅 使 用 EXPLAIN 命令 ， 则 输出 的 结果 是 估算 的 执行 计划 成 
本 。 如 果 加 上 了 ANALYZE 参数 ， 即 使 用 EXPLAIN (ANALYZE) 命 
令 ， 则 输出 的 分 析 结 果 中 还 会 包含 实际 执行 后 得 到 的 真实 成 本 。 


示例 9-2 是 示例 9-1 的 执行 输出 结 


示例 9-2 “EXPLAIN (ANALYZE) 的 执行 结 


Seq Scan on hisp_pop 
(cost=0.060..33.48 rows=1 width=16) 
(actual time=0.213. .0.346 rows=1 loops=1) 
Filter: ((tract id)::text = "25025016163 ' : :text) 


Rows Removed by Filter: 1477 
Planning time: 6.695 ms 
Execution time: 6.381 ms 





EXPLAIN 输出 的 执行 计划 会 包含 多 个 执行 步骤 。 每 一 步 都 会 有 一 个 
估算 的 执行 成 本 范围 ， 看 起 来 像 这 样 : cost=8.66..33.48 ， 如 示 
例 9-2 所 示 。 本 例 中 ， 第 一 个 数字 6.668 是 估算 的 该 步骤 的 起 始 执 
行 成 本 ， 第 二 个 数字 33 .84 是 估算 的 该 步骤 的 总 执行 成 本 。 起 始 

执行 时 间 点 之 前 会 执行 一 些 后 续 计 算 的 准备 动作 ， 而 读 取 数据 、 索 
引 扫描 、 多 表 数 据 关 联 整合 等 动作 都 是 在 起 始 执行 时 间 点 之 后 发 生 
的 。 如 果 执 行 方式 为 全 表 扫 描 ， 那 么 其 起 始 执行 成 本 为 0， 因为 这 
We 没有 什么 预备 
DD o 


请 注意 ， 估 算 的 执行 成 本 值 的 单位 并 不 是 真实 的 时 间 单 位 ， 其 单位 
取决 于 便 件 环境 以 及 执行 成 本 相关 的 参数 配置 。 因 此 ， 执 行 成 本 值 
仅 上 只 有 相对 意义 ， 可 用 于 比较 同一 台 物 理 服 务 器 上 多 个 执行 计划 的 
效率 。 规 划 器 的 任务 就 是 选 出 总 体 成 本 值 最 低 的 一 个 执行 计划 。 


因为 我 们 在 示例 9-1 中 加 入 了 ANALYZE 参数 ， 规 划 器 将 真实 地 执行 
查询 语句 ， 所 以 执行 时 间 中 还 会 包含 真正 的 执行 时 间 统 计 。 


通过 示例 9-2 中 的 执行 计划 可 以 看 到 规划 器 选择 了 全 表 扫 描 集 略 ， 
因为 没有 任何 索引 可 用 。 下 面 输出 的 Rows Removed by 
Filter:1477 是 扫描 过 程 中 排除 掉 的 不 符合 条 件 的 记录 数 。 


如 果 你 使 用 的 是 PostgreSQL 9.4 或 者 更 高 版 本 ，EXPLAIN 输出 的 执 
行 计 划 中 还 提供 了 执行 计划 分 析 时 间 和 真正 的 执行 时 间 。 执 行 计 划 
分 析 时 间 就 是 规划 器 分 析出 最 终 执行 计划 所 消耗 的 时 间 ; 执行 时 间 




















古 按照 执行 计划 执行 并 得 到 最 终结 果 所 用 的 时 间 。 
我 们 把 主键 重新 建 起 来 : 


ALTER TABLE census.hisp pop ADD CONSTRAINT hisp pop pkey PRIMARY KEY(t 


现在 再 次 执行 示例 9-1 的 语句 ， 得 到 的 输出 如 示例 9-3 所 示 。 
示例 9-3 ”使 用 了 索引 的 EXPLAIN (ANALYZE) 执行 计划 


Index Scan using idx hisp pop tract id pat on hisp_pop 
(cost=0.28..8.29 rows=1 width=16) 
(actual time=0.018. .6.019 rows=1 loops=1) 

Index Cond: ((tract id)::text = "256256010163 ' : :text) 


Planning time: 6.116 ms 
Execution time: 6.046 ms 





此 场景 下 规划 器 判定 使 用 索引 会 比 全 表 扫 描 效 率 更 高 ， 因 此 在 执行 
计划 中 使 用 了 索引 扫描 策略 。 估 算 的 执行 时 间 从 33.48 降 为 8.29。 

起 始 执行 成 本 也 不 再 是 0， 因为 规划 需 需 要 先 扫描 索引 ， 然 后 才能 
把 命中 的 记录 从 磁盘 取出 来 “如 果 所 需 数据 已 经 存 在 于 和 内存 组 存 

中 ， 也 有 可 能 是 直接 从 内 存 取 ) 。 你 也 可 以 看 到 规划 器 不 再 需要 扫 
描 1477 条 记录 ， 这 极 大 地 降低 了 执行 成 本 。 


对 于 如 示例 9-4 所 示 的 较 复 条 的 查询 ， 其 执行 计划 中 会 包含 更 多 的 
步 又， 这 些 步 又 也 称 为 子 执行 计划 。 每 一 个 子 执行 计划 都 有 和 它 目 己 
的 成 本 估算 值 ， 这 些 值 会 被 累加 到 总 执行 计划 的 成 本 估算 值 中 。 父 
执行 计划 显示 时 总 是 排 在 最 前 面 ， 其 中 记录 的 成 本 估算 值 和 真实 时 
间 值 就 是 其 所 有 子 计划 相应 项 目 值 之 和 。 子 计划 在 显示 时 是 按照 其 
层级 同 右 逐 级 缩 进 的 。 


示例 9-4 带 GROUP BY 和 SUM 的 语句 的 EXPLAIN 
(ANALYZE ) 分 析 


EXPLAIN (ANALYZE) 
SELECT left(tract id,5) AS county code, SUM(white alone) As w 

















FROM census.hisp pop 
WHERE tract id BETWEEN "250256006666' AND '258625999999' 
GROUP BY county_code 





示例 9-5 中 记录 的 是 示例 9-4 中 语句 的 执行 计划 ， 其 中 包含 分 组 和 
求 和 操作 。 


示例 9-5 ”包含 散 列 聚合 策略 的 EXPLAIN (ANALYZE) 分 析 结 
果 


HashAggregate 
(cost=29.57..32.45 rows=192 width=16) 
(actual time=0.664..0.664 rows=1 loops=1) 
Group Key: "left"((tract id)::text, 5) 
-> Bitmap Heap Scan on hisp_pop 
(cost=16.25..28.61 rows=192 width=16) 
(actual time=0.441. .6.556 Fows=264 loops=1) 
Recheck Cond : 
(((tract id)::text >= "250250006066 ' : :text) AND 
((tract id)::text <= "25025999999 ' : :text) ) 


Heap Blocks: exact=15 

-> Bitmap Index Scan on hisp_pop_pkey 
(cost=0.660..160.26 rows=192 width=6) 
(actual time=0.421. .0.421 Fows=204 loops=1) 
Index Cond : 


(((tract id)::text >= "25025000666 ' : :text) AND 
((tract id)::text <= "250625999999 ' : :text) ) 
Planning time: 4.835 ms 
Execution time: 8.732 ms 





示例 9-5 中 所 示 执 行 计划 的 顶层 步骤 是 一 个 散 列 聚合 操作 。 该 操作 
包含 一 个 位 图 表 扫 描 子 计划 ， 该 位 图 表 扫 描 子 计划 又 包含 了 一 个 位 
图 索引 扫描 子 计 划 。 在 本 例 中 ， 因 为 我 们 是 第 一 次 执行 此 语句 ， 所 
以 执行 计划 分 析 时 间 远 远 超过 了 真正 的 执行 时 间 。 但 PostgreSQL 

有 执行 计划 以 及 数据 缓存 功能 ， 所 以 如 果 我 们 再 次 执行 该 语句 ， 或 
者 执行 一 个 可 以 共 至 缓存 下 来 的 执行 计划 的 类 似 语句 ， 那 么 执行 计 
划 的 分 析 时 间 就 会 大 大 减少 ， 而 且 真 正 的 执行 时 间 也 可 能 会 减少 ， 
因为 该 语句 执行 期 间 所 需 的 很 多 数据 可 能 已 经 缓存 在 内 存 中 了 。 由 
于 刚刚 提 到 的 这 些 缓存 功能 ， 我 们 第 二 次 的 运行 时 间 统 计数 据 如 








Planning time: 6.266 ms 
Execution time: 8.635 ms 





9.1.3 ”图形 化 展示 执行 计划 
如 果 你 觉得 阅读 纯 文 字形 式 的 执行 计划 是 一 件 痛 苗 的 事 ， 那 么 图 9- 


1 中 演示 的 图 形 化 执行 计划 (对 应 EXPLAIN (ANALYZE) 命令 行 ) 
会 解除 你 的 烦恼 。 


hisp_pop Aggregate 











hisp_pop_pkey 





Actual Rows 204 

Node Type Bitmap Index Scan 

Index Cond (((tract_id):-text >= "25025000000"--text) AND {(tract_id):-text <= 25025999999-:-text)) 
Actual Startup Time 0.108 

Parallel Aware false 


Actual Total Time 0.108 

Parent Relationship Outer 

Actual Loops 

Index Name hisp_pop_pkey 


图 9-1: 图 形 化 展示 执行 计划 
你 只 需 将 鼠标 放 到 图 标 上 就 能 看 到 每 个 步 又 的 详细 信息 。 


在 结束 本 节 之 前 ， 我 们 要 癌 你 介绍 一 个 表格 形式 的 执行 计划 展示 工 
具 (http://explain.depesz.com/ ) ， 该 工具 由 Hubert Lubaczewski 创 
建 ， 在 此 我 们 同 他 表示 感谢 。 打 开工 具 地 址 ， 然 后 将 文本 格式 的 执 
0 就 可 以 得 到 一 个 格式 化 得 非常 漂亮 的 表格 ， 如 图 
9-2 所 不 。 





Did it help? Consider supporting us 
Per node type stats 


Bitmap Heap Scan 0.129 ms 19.4 % 
Bitmap Index Scan 1 0.421 ms 63.4 % 
HashAggregate 1 0.114 ms 17.2 % 


Per table stats 


hisp_pop 0.129 ms 19.4% 
Bitmap Heap Scan 1 0.129 ms 100.0 % 


图 9-2: 在 线 执行 计划 分 析 工 具 


在 输出 的 HTML 表格 中 ， 你 可 以 有 到 经 过 格 陈 重 排 的 这 颜色 分 区 
的 执行 计划 表 ， 其 中 会 以 显眼 的 颜色 高 亮 显 示 有 问题 的 部 分 ， 如 图 
9-3 所 示 。 表 格 中 的 exclusive 列表 示 当 前 步骤 的 操作 所 耗 时 间 ， 
inclusive 列表 示 当 前 步骤 及 其 所 有 子 步骤 的 操作 所 耗 时 间 。 


exclusive | inclusive | rows x | rows loops | node 








和 . | 0.664 lS920 1 1 | ~ HashAggregate (cost=29.57..32.45 rows=192 width=16) 
(actual time=0.664..0.664 rows=1 loops=1) 
Group Key: "left"((tract_id):-text, 5) 

2 jy 204 1 ~ Bitmap Heap Scan on hisp_pop 


(cost=10.25..28.61 rows=192 width=16) 
(actual time=0.441..0.550 rows=204 loops=1) 


Recheck Cond: (((tract_id):-text >= '25025000000':text) AND 
((tract_id)--text <= '25025999999' :text)) 


Heap Blocks: exact=15 


3. E11 204 1 中 Bitmap Index Scan on hisp_pop_pkey 
(cost=0.00..10.20 rows=192 width=0) 
(actual time=0.421..0.421 rows=204 loops=1) 
Index Cond: (((tract_id):-text >= '25025000000'--text) AND 
((tract_id):-text <= '25025999999'…-text)) 


图 9-3: 表格 式 的 执行 计划 分 析 结 果 


管 图 9-3 中 HIML 表格 形式 的 执行 计划 提供 的 信息 与 纯 文本 形式 
的 执行 计划 其 [ 实 是 一 模 一 样 的 ， 但 使 用 “彩色 编码 ”和 “分 步 又 操作 
时 间 统 计 ” 这 两 个 功能 ， 用 户 可 以 更 轻松 地 对 分 析 结 果 进 行 深 入 分 





析 和 挖掘 。 黄 色 、 神 色 以 及 红色 的 格子 是 潜在 的 性 能 瓶颈 。 


rows Xx 这 一 栏 表示 预 估 查 询 出 的 记录 数 ，rows 栏 显示 的 是 执行 完 
毕 后 实际 查 出 的 记录 数 。 上 表 中 显示 的 就 是 预 估 能 返回 192 行 记 
录 ， 但 实际 仪 返回 1 条。 估算 的 记录 数 不 准 ， 一 般 是 因为 表 的 统计 
信息 未 及 时 更 新 所 导致。 所 以 经 常 性 地 对 表 进 行 分 析 操 作 是 个 好 习 
惯 ， 表 的 分 析 操 作 可 以 更 新 表 上 的 统计 信息 ， 特 别 是 刚刚 对 表 进 行 
过 大 规模 的 更 新 或 者 插入 操作 后 ， 表 分 析 操 作 很 有 必要 。 














01. 9.2 ”搜集 语句 的 执行 统计 信息 


性 能 调 优 的 第 一 步 就 是 要 确定 哪些 语句 是 性 能 瓶 席 。PostgreSQL 提 
供 了 一 个 名 为 pg_stat_statements 的 性 能 监控 扩展 包 以 帮助 用 
户 找 出 耗 时 最 长 的 语句 。 该 扩展 包 能 提供 所 有 执行 过 的 SQL 语句 
的 统计 上 度量 信息 ， 包 括 哪些 语句 执行 得 最 频 莹 以 及 每 个 语句 的 执行 
总 耗 时 等 。 基 于 这 些 信息 我 们 可 以 知道 应 将 优化 的 重点 放 在 哪里 。 


大 多 数 PostgreSQL 版 本 都 自 带 pg_stat_statements 扩展 包 ， 但 
启动 时 必须 明确 指定 预 加 载 其 动态 库 ， 这 样 系统 才 会 启动 用 于 搜集 
统计 数据 的 后 台 进 程 。 设 置 方 法 如 下 所 示 。 


(1) 在 postgresql.conf 配置 文件 中 ， 将 
shared_preload libraries 更 改 为 
shared preload libraries 'pg_stat statements'。 


(2) 在 postgresql.conf 文件 的 自 定 义 选项 部 分 ， 添 加 以 下 几 行 。 











pg_stat_statements .max = 10666 
pg_stat statements.track = all 





(3) 重启 postgresql 服务 。 


(4) 登录 到 每 一 个 希望 进行 SQL 语句 性 能 统计 的 database 中 并 执行 
语句 : CREATE EXTENSION pg stat statements;。 
该 扩展 包 提供 了 以 下 两 个 关键 功能 。 
。 一 个 名 为 pg_stat_statements 的 视图 ， 其 中 可 以 查询 到 当 
前 登录 用 户 在 各 database 中 执行 过 的 所 有 SQL 语句 的 统计 信 
自 


。 a pg_stat_statements_reset 的 函数 ， 该 函数 可 以 
将 到 目前 为 止 的 语句 执行 统计 信息 全 部 清空 ， 不 过 只 有 超级 用 
户 才 有 权限 执行 此 函数 。 





示例 9-6 中 的 语句 可 以 查 出 postgresql_book 这 个 database 中 最 
耗 时 的 5 个 SQL 语句 。 


示例 9-6 ” 找 出 特定 database 中 最 耗 时 的 语句 


SELECT 

query, calls, total time, rows, 

1660.6*shared blks hit/NULLIF(shared blks hit+shared blks read,0) A 
FROM pg stat statements As s INNER JOIN pg database As d On d.oid = s. 


WHERE d.datname = 'postgresql book' 
ORDER BY total time DESC LIMIT 5; 





01. 9.3 ”编写 更 好 的 SQL 语句 


最 好 也 最 简单 的 性 能 调 优 方法 就 是 学 会 编写 优秀 的 SQL 语句 。 我 
们 在 大 多 数 客户 的 项 目 中 见 过 的 SQL 语句 都 写 得 不 够 好 ， 它 们 未 
能 发 挥 出 PostgreSQL 的 真正 威力 。 


写 出 的 SQL 语句 很 糟糕 一 般 有 两 个 主要 原因 。 第 一 个 原因 是 很 多 
人 会 盲目 地 复 用 以 前 的 SQL 编写 经 验 。 例 如 ， 有 人 曾经 写 过 一 个 
使 用 了 左 连接 的 SQL 语句 并 且 执 行 效果 还 不 错 ， 那 么 他 此 后 不 管 
实际 情况 是 什么 样 都 一 直 使 用 左 连接 语法 ， 但 实际 上 ， 在 有 更 多 表 
参与 关联 运算 的 情况 下 ， 最 好 是 使 用 内 连接 。 与 其 他 很 多 编程 语言 
不 一 样 ，SQL 语言 的 编写 经 验 不 能 盲目 地 复 用 。 


第 二 个 原因 是 人 们 对 于 最 新 的 SQL 语法 特性 一 般 无 法 及 时 跟 进 并 
学 习 了 解 。 不 要 对 PostgreSQL 新 版 本 中 引入 的 那些 新 语法 不 以 为 
意 ， 它 们 可 以 简化 开发 ， 也 可 以 让 你 少 费 脑筋 ， 因 此 要 积极 地 学 习 
并 利用 起 来 。 


要 想 编写 出 局 效 的 SQL 是 需要 很 多 练习 的 。 只 要 你 编写 的 SQL 语 
句 能 得 到 正确 结果 ， 那 么 这 个 语句 就 不 能 算 错 ， 但 其 性 能 可 能 很 
差 。 本 市 中 我 们 将 指出 人 们 常 犯 的 一 些 错误 。 尺 管 本 书 是 关于 
I 
据 库 。 


9.3.1 在 SELECT 语句 中 小 用 子 查 询 


新 手 第 犯 的 一 个 错误 残 是 容易 将 子 查 询 当 成 一 个 完全 独立 的 数据 集 
来 使 用 。SQL 语言 有 一 个 与 传统 的 编程 语言 很 不 一 样 的 地 方 ， 就 是 
SQL 语言 中 并 没有 很 强烈 的 < 黑 盒 " 概 念 。 也 就 是 说 ， 编 写 一 堆 互 相 
独立 的 子 查 询 并 把 每 个 子 查 询 当 作 一 个 “ 黑 盒 ”数据 块 来 看 得 ， 只 要 
能 得 到 最 后 结果 就 行 ， 而 不 管 其 他 ， 这 种 思路 是 错误 的 。 它 事实 上 
制 裂 了 子 人 查询 代码 块 内 部 处 理 逻 辑 与 子 查 询 代 码 块 外 部 处 理 逻 辑 之 
间 的 联系 ， 没 有 将 整个 SQL 语句 当成 一 个 有 机 的 整体 来 处 理 。 从 
多 个 子 但 询 中 取 数 据 与 从 多 个 表 或 者 视图 中 取 数 据 一 样 章 要 ， 代 码 
写 得 不 好 效率 就 会 很 低 。 












































示例 9-7 中 演示 了 一 个 小 用 子 查 询 的 例子 ， 把 子 碍 询 当 黑 盒 使 用 的 
思想 就 会 导致 这 种 写法 。 


示例 9-7 ”滥用 子 碍 询 


SELECT tract id， 
(SELECT COUNT(*) FROM census .facts As F 
WHERE F.tract id = T.tract id) As num facts， 
(SELECT COUNT(*) 
FROM census.lu fact _ types As Y 
WHERE Y.fact type id IN ( 
SELECT fact type_ id 


FROM census.facts F 
WHERE F.tract id = T.tract id 
) 
) As num fact types 
FROM census.lu tracts As T; 











上 面 的 SQL 语句 如 果 改 为 示例 9-8 的 写法 效率 会 更 高 。 下 面 的 写 
法 合并 了 多 个 SELECT 动作 并 使 用 了 关联 得 询 机 制 ， 不 但 比 上 面 的 
语句 更 简短 ， 速 度 也 更 快 。 如 果 表 的 数据 量 很 大 或 者 硬件 性 能 较 
差 ， 这 两 种 写法 之 间 的 性 能 差异 会 更 明显 。 


示例 9-8 ”针对 小 用 子 查询 的 语句 的 简化 改写 





SELECT T.tract id， 
COUNT(f.fact type id) As num facts, 
COUNT(DISTINCT fact type id) As num fact types 


FROM census.lu tracts As T LEFT JOIN census.facts As F ON T.tract id = 
GROUP BY T.tract_ id; 





图 9-4 显示 的 是 示例 9-7 中 的 语句 的 执行 计划 ， 为 了 帮 你 解除 查看 
字符 型 执行 计划 的 痛 苗 ， 我 们 选择 了 以 图 形 化 方式 展示 。 图 9-5 使 
用 http://explain.depesz.com 站 点 提供 的 工具 将 其 执行 计划 转换 为 以 
HTML 表格 方式 呈现 ， 也 可 以 提高 你 的 碍 看 效率 。 
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图 9-4: 滥用 子 查 询 的 SQL 语句 的 执行 计划 图 形 化 展示 
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图 9-5: 滥用 子 查 询 的 SQL 语句 的 执行 计划 表格 式 展示 


图 9-6 显示 的 是 示例 9-8 中 简化 后 语句 的 执行 计划 ， 从 图 中 可 以 看 
到 简化 了 多 少 执行 步骤 。 
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图 9-6: 删除 多 余子 查询 后 的 执行 计划 图 形 化 展示 


请 注意 ， 我 们 并 没有 要 求 你 完全 不 用 子 查 询 ， 只 是 建议 你 在 确 有 必 
要 时 才 使 用 ， 并 且 使 用 时 应 当 注 意 考 虑 如 何 将 子 碍 询 与 SQL 语句 
的 主干 融合 ， 也 许 你 会 发 现 根本 不 需要 通过 子 碍 询 来 实现 你 所 斋 要 
的 功能 。 总 之 请 牢记 : 子 伍 询 不 是 独立 的 黑 盒 数据 块 ， 应 与 主语 句 
通盘 考虑 后 再 结合 使 用 。 


9.3.2 ”尽量 避免 使 用 SELECT * 语法 


SELECT * 经 党 会 导致 性 能 浪费 ， 会 出 现 仅仅 需要 10 页 数据 却 查 出 
1000 页 数据 这 种 情况 ， 这 显然 会 导致 网 络 传输 负担 加 大 ， 而 且 还 
会 出 现 两 个 你 可 能 意 想 不 到 的 问题 。 


第 一 个 问题 与 大 对 象 有 关 。PostgreSQL 会 使 用 TOAST (The 
Oversized-Attribute Storage Technique， 即 超大 尺寸 属性 存储 技术 ) 
机 制 来 存储 二 进 制 大 对 象 以 及 超大 文本 。TOAST 机 制 会 将 超过 主 
表 存 储 限制 的 数据 存储 到 一 张 辅助 表 中 ， 并 可 能 把 单个 文本 字段 拆 
分 为 多 行人 存储。 因此 ， 读 取 超 大 字段 就 需要 从 辅助 的 TOAST 表 中 
查询 出 多 条 记录 。 举 个 例子 ， 如 果 某 表 包 含 文本 数据 ， 其 中 存储 了 
一 整 部 《战争 与 和 平 》 这 么 庞大 的 内 容 ， 然 后 你 对 这 个 表 做 了 一 个 
SELECT * 操作 ， 那 么 不 难 想象 这 个 操作 会 慢 到 什么 程度 。 


第 二 个 问题 与 视图 有 关 。 我 们 定义 视图 的 时 候 一 般 做 不 到 完全 精确 
地 指定 列 ， 也 就 是 说 视图 中 一 般 会 带 寿 干 可 能 不 需要 的 列 。 

PostgreSQL 的 视图 定义 功能 是 很 强大 的 ， 你 可 以 使 用 SELECT * 语 
句 来 定义 视图 ， 系 统 会 自动 将 星 号 蔡 换 为 目的 表 的 完整 字段 列表 ， 
你 也 可 以 在 视图 定义 语句 中 包含 复杂 运算 表达 式 以 及 关联 查询 。 这 
些 创 建 视 图 的 语句 都 是 合法 的 ， 没 有 任何 问题 ， 但 用 户 访问 时 就 麻 
烦 了 ， 一 旦 对 这 种 复杂 视图 执行 SELECT * 查询 ， 那 么 视图 定义 中 









































所 有 的 复杂 列 都 会 经 历 漫 长 的 运算 过 程 ， 总 体 查 询 速度 会 很 慢 。 


为 了 解释 清楚 以 上 观点 ， 下 面 以 示例 9-7 中 带子 查询 的 语句 为 基础 
创建 一 个 视图 ， 使 用 的 基 表 是 census 中 的 表 。 





CREATE OR REPLACE VIEW vw stats AS 
SELECT tract_ id, 
(SELECT COUNT(*) 
FROM census.facts As F 
WHERE F.tract id = T.tract id) As num facts, 
(SELECT COUNT(*) 
FROM census.lu fact types As Y 
WHERE Y.fact type id IN ( 
SELECT fact type_id 
FROM census.facts F 
WHERE F.tract id = T.tract id 
) 
) As num fact types 
FROM census.lu tracts As T; 





现在 我 们 针对 此 视图 执行 以 下 语句 : 


SELECT tract id FROM vw_ stats; 


在 我 们 的 测试 环境 中 该 语句 的 执行 大 约 耗 时 21 坚 秒 ， 速 度 很 快 ， 
因为 该 语句 没有 访问 num_facts 和 num_fact_type 这 两 个 视图 字 
段 ， 这 两 个 字段 需要 经 过 复杂 的 运算 才能 得 到 结果 。 你 查看 一 下 该 
语句 的 执行 结果 就 可 以 发 现 ， 其 中 没有 任何 一 个 步骤 会 访问 facts 
表 ， 因 为 规划 器 分 析 该 语句 后 知道 根本 不 需要 访问 此 表 。 但 如 果 我 
们 使 用 下 面 的 语句 来 访问 上 述 视图 : 


SELECT * FROM vw stats; 


在 我 们 的 环境 中 执行 时 间 将 碳 升 到 681 坚 秒 ， 其 执行 计划 如 图 9-4 
所 示 。 这 里 前 后 两 个 语句 的 性 能 兰 别 是 坚 秒 级 ， 但 如 果 表 的 记录 数 











增加 到 千 万 级 ， 列 数 增加 到 数 百 个 ， 那 么 这 两 个 语句 的 性 能 差异 就 
非常 大 了 。 按 照 前 一 种 写法 ， 碍 询 可 以 很 快 完成 ， 你 可 以 搞定 后 准 
点 下 班 ; 按照 后 一 种 写法 ， 你 就 得 竺 在 办 公 室 加 班 来 等 这 个 查询 执 


9.3.3” 善 用 CASE 语法 


CASE 是 ANSI SQL 标准 语法 ， 其 功能 很 强大 ， 但 利用 它 的 人 却 很 
少 ， 我 们 对 此 感到 很 惊讶 。 在 很 多 需要 聚合 运算 的 场景 中 ， 使 用 
CASE 语法 能 够 有 效 替 代 子 查询 。 接 下 来 我 们 使 用 两 个 例子 来 演示 
这 一 点 ， 一 个 使 用 CASE ， 一 个 使 用 子 查询 ， 然 后 比较 二 者 的 执行 
计划 和 性 能 差异 。 示 例 9-9 使 用 了 子 查询 语法 。 


示例 9-9 ”使 用 子 查 询 而 非 CASE 











SELECT T.tract id, COUNT(*) As tot, type 1.tot AS type 1 
FROM 
census.lu tracts AS T LEFT JOIN 
(SELECT tract id, COUNT(*) As tot 
FROM census .facts 
WHERE fact type id = 131 


GROUP BY tract id 
) As type 1 ON T.tract id = type 1.tract id LEFT JOIN 
census.facts AS F ON T.tract id = F.tract id 
GROUP BY T.tract_ id, type 1.tot; 





图 9-7 是 示例 9-9 的 执行 计划 图 示 。 
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图 9-7: 使 用 子 查 询 而 非 CASE 的 执行 计划 


然后 我 们 使 用 CASE 语法 改写 这 个 碍 询 。 你 会 发 现 优化 后 的 查询 效 
率 更 局 ， 也 更 容易 理解 ， 如 示例 9-10 所 示 。 





示例 9-10 ”使 用 CASE 语法 替代 子 查 询 


SELECT T.tract id, COUNT(*) As tot， 
COUNT(CASE WHEN F.fact type _ id = 131 THEN 1 ELSE NULL END) AS type 
FROM census.lu tracts AS T LEFT JOIN census .facts AS F 


ON T.tract id = F.tract id 
GROUP BY T.tract id; 





图 9-8 是 示例 9-10 中 语句 的 执行 计划 图 示 。 
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图 9-8: 使 用 CASE 代 蔡 子 查 询 后 的 执行 计划 


尽管 优化 后 的 语句 依然 没 用 上 fact type 索引， 但 其 执行 效率 还 
是 提升 了 ， 因 为 规划 器 仅 对 facts 表 做 了 一 次 扫描 。 一 般 来 说 ， 
执行 计划 越 短 小 ， 其 执行 过 程 束 越 容易 理解 ， 执 行 效 率 也 越 高 ， 不 
过 这 并 不 是 绝对 的 。 


9.3.4 使 用 Filter 语法 替代 CASE 语法 


PostgreSQL 9.4 中 引入 了 新 的 FILTER 关键 字 ，7.15 节 中 介绍 过 其 
用 法 。 在 使 用 了 CASE 的 聚合 函数 中 总 是 可 以 用 FILTER 来 代替 
CASE ， 蔡 换 以 后 不 但 语法 上 看 起 来 更 整洁 ， 而 且 在 很 多 场景 下 执 
行 效率 也 会 有 所 提高 。 在 示例 9-11 中 ， 我 们 使 用 FILTER 对 示例 
9-10 的 语句 进行 了 改写 。 


示例 9-11 ”使 用 FILTER 语法 来 蔡 代 子 查 询 


























SELECT T.tract id, COUNT(*) As tot， 
COUNT(*) FILTER (WHERE F.fact type_ id = 131) AS type 1 
FROM census.lu tracts AS T LEFT JOIN census.facts AS F 


ON T.tract id = F.tract id 
GROUP BY T.tract id; 





在 我 们 的 测试 环境 中 ， 用 FILTER 替换 CASE 后 ， 性 能 提升 仅 有 大 





约 1 军 秒 ， 而 且 两 种 写法 的 执行 计划 也 基本 类 似 。 


01. 9.4 ”并 行 化 语句 执行 


并 行 化 语句 的 执行 过 程 会 被 规划 器 分 发 给 多 个 后 台 进 程 去 执行 。 通 
过 这 种 并 行 执行 方式 ，PostgreSQL 能 够 充分 发 挥 多 核 处 理 器 的 威 
力 ， 从 而 让 语句 执行 更 快 完 成 。 通 过 并 行 执行 所 能 节省 的 时 间 根 据 
服务 器 上 CPU 核 数 的 多 址 而 有 所 不 同 ， 机 器 强大 的 情况 下 有 可 能 
是 非 浓 可 观 的 。 两 核 的 机 器 上 可 能 节省 50% 的 时 则 ， 四 核 的 机 器 
上 可 能 节省 75% 的 时 间 。 


并 行 化 特性 在 PostgreSQL 9.6 中 引入 ， 当 时 能 够 支持 并 行 化 的 语句 
类 型 比较 有 限 ， 一 般 仅 包括 那 种 比较 直观 的 查询 语句 。 但 随 着 新 版 
本 的 发 布 ， 我 们 希望 有 越 来 越 多 类 型 的 语句 能 够 支持 并 行 化 。 


在 PostgreSQL 10 中 ， 不 能 并 行 化 的 语句 类 型 如 下 。 


。 所 有 DML 数据 操纵 语句 ， 比 如 更 新 、 插 入 和 删除 操作 。 

。 所 有 DDL 数据 定义 语句 ， 比 如 建 表 、 加 字段 、 建 索引 等 。 

。 在 游标 遍历 过 程 中 或 者 循环 体 中 执行 的 查询 语句 。 

。 部 分 聚合 操作 。 常 见 的 COUNT 和 SUM 聚合 都 已 支持 并 行 化 ， 
但 DISTINCT 和 ORDER BY 还 不 支持 。 

。 自 定义 函数 。 默 认 情 况 下 ， 目 定义 函数 被 设置 为 PARALLEL 
UNSAFE 模式 ， 即 不 能 安全 地 进行 并 行 化 操作 ， 但 如 果 你 确定 
你 的 自 定义 函数 是 可 以 并 行 的 ， 那 么 可 以 通过 8.1 节 中 介绍 的 
PARALLEL 相关 参数 来 启用 自 定 义 函数 的 并 行 化 能 


Sr ， 请 遵循 以 下 指导 进行 系统 参数 配 











e。 dynamic_shared_memory 不 允许 设置 为 none 。 

max_worker_processes 需要 设置 为 大 于 0。 

max_parallel_workers 是 PostgreSQL 10 中 新 引入 的 一 个 参 

数 ， 需 要 设置 为 大 于 0 并 且 小 于 max_worker_processes 的 

值 。 

。max_parallel workers_per_gather 需要 设置 为 大 于 0 并 
且 小 于 等 于 max_worker_processes 的 值 。 对 PostgreSQL 10 
来 说 ， 该 参数 的 值 还 必须 小 于 等 于 max_parallel_workers 


。 访 参数 可 以 在 会 话 级 或 者 函数 级 进行 设置 。 
9.4.1 并 行 化 的 执行 计划 是 什么 样子 


我 们 如 何 知 道 一 个 语句 已 经 真正 地 被 并 行 化 执行 了 呢 ? 当然 是 通过 
执行 计划 查看 最 直观 。 并 行 化 功能 是 通过 规划 器 中 一 个 名 为 采集 节 
点 (gather node) 的 模块 实现 的 。 因 此 如 果 你 在 执行 计划 中 看 到 了 
gather node 字样 ， 那 么 说 明 该 语句 已 经 或 多 或 少 地 用 上 了 并 行 化 功 
能 了 。 一 个 采集 节点 仪 包 售 一 个 执行 计划 ， 然 后 会 把 该 执行 计划 分 
发 给 多 个 worker 去 执行 。 每 个 worker 就 是 一 个 独立 的 PostgreSQL 
后 台 进 程 ， 每 个 后 台 进 程 负 责 处 理 整 个 查询 中 的 一 部 分 工作 。 所 有 
worker 的 工作 成 果 会 被 一 个 担任 leader 角色 的 worker 搜集 到 一 

起 。 担 任 leader 角色 的 worker 和 其 他 普通 worker 一 样 ， 也 要 处 理 
gather node 分 派 给 自己 的 计算 任务 ， 但 它 比 其 他 普通 worker 多 一 
项 任务 ， 就 是 要 搜集 所 有 普通 worker 的 工作 成 果 。 如 果 gather 
node 是 整个 执行 计划 的 根 节 点 ， 那 么 说 明 整 个 执行 计划 是 彻底 并 行 
化 执行 的 ， 如 果 gather node 出 现在 比较 低 的 层级 中 ， 那 么 只 有 对 应 
层级 的 工作 是 并 行 化 的 。 


为 了 便于 调试 ， 我 们 可 以 借助 一 个 名 为 force_parallel_mode 的 
参数 。 当 该 参数 被 设置 为 true 时 ， 规 划 器 会 用 并 行 模式 去 执行 所 
有 可 并 行 化 的 语句 ， 即 使 规划 器 判定 使 用 并 行 模式 并 不 会 比 非 并 行 
模式 快 ， 它 也 会 这 么 干 。 当 需要 判定 一 个 语句 为 什么 没有 被 并 行 化 
执行 时 ， 该 参数 非常 有 用 。 但 请 切记 ， 不 要 在 正式 的 生产 环境 中 打 
开 该 参数 ! 

目前 为 止 ， 我 们 在 本 章 中 给 出 的 例子 都 不 会 触发 并 行 执行 ， 因 为 将 
其 并 行 化 执行 需要 启动 后 台 进 程 ， 而 启动 这 些 后 台 进 程 的 成 本 已 经 
超过 了 并 行 化 带 来 的 收益 。 为 了 确认 有 的 语句 在 并 行 化 执行 的 情况 
下 反而 比 没有 并 行 化 更 慢 ， 先 设置 该 参数 : 


Set force parallel mode = true; 


然后 再 次 运行 示例 9-4， 其 输出 结果 如 示例 9-12 所 示 。 


示例 9-12 ”通过 EXPLAIN (ANALYZE) 命令 得 到 并 行 执行 计 




















划 


Gather 
(cost=1629.57..1651.65 rows=192 width=64) 
(actual time=12.881..13.947 rows=1 loops=1) 
Workers Planned: 1 
Workers Launched: 1 
Single Copy: true 
-> HashAggregate 
(cost=29.57..32.45 rows=192 width=64) 
(actual time=0.230..0.231 rows=1 loops=1) 
Group Key: "left"((tract id)::text, 5) 
-> Bitmap Heap Scan on hisp_pop 
(cost=16.25..28.61 rows=192 width=36) 
(actual time=0.127. .0.184 Fows=204 loops=1) 
Recheck Cond : 
(((tract id)::text >= "25025000666 ' : :text) AND 
((tract id)::text <= "256025999999 ' : :text) ) 
-> Bitmap Index Scan on hisp_pop_pkey 
(cost=0.66..160.26 rows=192 width=6) 
(actual time=0.106..6.166 Fows=204 loops=1) 
Index Cond : 
(((tract id)::text >= "250250006066 ' : :text) AND 
((tract id)::text <= "25625999999 ' : :text)) 
Planning time: 6.416 ms 
Execution time: 16.166 ms 





可 以 看 到 ， 局 动 额 外 的 worker( 即 使 只 启动 一 个 ) 带 来 的 时 间 消 耗 
显著 地 增加 了 总 体 碍 询 所 需 的 时 间 。 


一 般 来 说 ， 对 于 耗 时 几 毫 秒 的 查询 语句 做 并 行 化 是 没什么 必要 的 。 

但 需要 访问 极 大 数据 集 的 查询 通常 需要 耗 时 几 秒 甚至 几 分 钟 ， 此 时 

并 行 化 的 价值 就 能 体现 出 来 了 ， 和 初始化 时 局 动 额外 worker 的 成 本 

会 远 远 小 于 并 行 化 带 来 的 收益 。 

为 了 演示 并 行 化 的 威力 ， 我 们 下 载 了 美国 劳动 统计 局 的 一 份 数 据 ， 

4 
人 钞 。 


示例 9-13 并行 化 的 GROUP BY 操作 





set max_parallel_workers_per_gather=4; 
EXPLAIN ANALYZE VERBOSE 

SELECT COUNT(*), area type code 

FROM labor 

GROUP BY area type_ code 

ORDER BY area type code; 


Finalize GroupAggregate 
(cost=164596.49. .104596.61 rows=3 Width=16) 
(actual time=566.446..569.444 rows=3 loops=1) 
Output: COUNT(*), area type_code 
Group Key: labor.area type_code 
-> Sort 
(cost=164596.49. .104596.52 rows=12 width=108) 
(actual time=566.433..500.435 rows=15 loops=1) 
Output: area type code, (PARTIAL COUNT(*)) 
Sort Key: labor.area type code 
Sort Method: quicksort Memory: 25KB 
-> Gather 
(cost=164595.05. .104596.28 rows=12 width=108) 
(actual time=560.159..5060.382 rows=15 loops=1) 
Output: area type code, (PARTIAL COUNT(*)) 
Workers Planned: 4 
Workers Launched: 4 
-> Partial HashAggregate 
(cost=163595.05. .103595.68 rows=3 Width=16) 
(actual time=483.081. .483.982 rows=3 loops=5) 
Output: area type code, PARTIAL count(*) 
Group Key: labor.area type_code 
Worker 6: actual time=476.765..476.766 rows=3 loops=1 
Worker 1: actual time=486.7604. .486.765 rows=3 loops=1 
Worker 2: actual time=486.598. .486.599 rows=3 loops=1 
Worker 3: actual time=478.06060. .478.6066 rows=3 loops=1 
-> Parallel Seq Scan on public.1abor 
(cost=6.66..95516.76 Fows=1615676 width=2) 
(actual time=1.550. .282.833 rows=1292543 loops=5) 
Output: area type code 
Worker 6: actual time=0.0678..282.698 rows=1278313 
Worker 1: actual time=3.497..282.668 Fows=1338695 
Worker 2: actual time=3.378..281.273 rows=1232359 
Worker 3: actual time=6.761..278.613 rows=1318569 
Planning time: 0.666 ms 
Execution time: 512.667 ms 





为 了 拿 未 开启 并 行 时 的 执行 成 本 估算 和 执行 时 间 来 进行 对 比 ， 我 们 


设置 max_parallel workers_per_gather=8 ， 然 后 拿 到 执行 计 
划 ， 如 示例 9-14 所 示 。 


示例 9-14 ” 非 并 行 化 执行 的 GROUP BY 操作 


set max_ parallel workers per gather=0; 
EXPLAIN ANALYZE VERBOSE 

SELECT COUNT(*), area type code 

FROM labor 

GROUP BY area type _ code 

ORDER BY area type code; 


Sort 
(cost=176366.24. .176366.25 rows=3 Width=16) 
(actual time=1647.066. .1647.666 rows=3 loops=1) 
Output: (COUNT(*)), area type code 
Sort Key: labor.area type code 
Sort Method: quicksort Memory: 25KkB 


-> HashAggregate 
(cost=176366.19. .176366.22 rows=3 Width=16) 
(actual time=1647.025. .1647.025 rows=3 loops=1) 
Output: count(*), area type_code 
Group Key: labor.area type_code 
-> Seq Scan on public.1labor 
(cost=0.60..143986.79 rows=6462679 width=2) 
(actual time=0.076. .626.563 rows=6462713 loops=1) 
Output: series id, year, period, value, footnote codes, ar 
Planning time: 0.654 ms 
Execution time: 1647.115 ms 





两 种 执行 模式 下 得 到 的 结果 是 一 样 的 : 


| area type_code 
ee 二 +--------------- 


638571 
(3 rows) 





在 并 行 化 模式 下 ， 总 共 四 个 worker， 每 个 worker 完成 自己 的 工作 


大 约 耗 时 280 毫秒 。 
9.4.2 ”并行 化 扫描 


并 行 执行 模式 下 有 专门 的 扫描 策略 来 将 整个 扫描 任务 切 分 给 多 个 
worker。 在 PostgreSQL 9.6 中 ， 只 有 全 表 扫 接 可 以 并 行 执行 。 
PostgreSQL 10 中 新 增 了 对 位 图 堆 扫 摘 (bitmap heap scan) 、 索 引 
扫描 (index scan) 以 及 仅 索 引 扫描 工 Cindex-only scan) 的 并 行 化 
文 持 。 然 而 对 于 索引 扫描 和 仪 索 引 扫 描 ， 目 前 还 只 有 当 使 用 了 B- 
树 索 引 时 才能 实现 并 行 。 位 图 堆 扫 描 则 无 此 限制 ， 基 于 任何 类 型 索 
引 的 位 图 堆 扫 摘 操 作 过 程 都 可 以 实现 并 行 。 但 请 注意 ， 位 图 堆 扫 擂 
过 程 中 的 建 位 图 索引 步 又 是 不 可 并 行 的 ， 因 此 所 有 的 worker 必须 
等 到 位 图 索引 构建 完毕 才能 开始 并 行 工作 。 


1 指 查 询 目标 字段 上 全 部 都 建 有 索引 ， 因 此 仅 需 扫描 索引 即 可 得 到 结果 ， 无 须 访问 本 
表 。 一 一 译 者 注 




































































“位 图 堆 扫描 过 程 简要 说 明 如 下 : 先 根 据 表 本 体 所 占用 的 物理 磁盘 PAGE 数 建立 一 个 位 
区 ， 其 中 每 个 BIT 位 都 对 应 表 本 体 上 的 一 个 物理 磁盘 PAGE 页 面 。 然 后 把 从 索引 上 查 
出 来 的 目标 记录 位 置 写 入 该 位 图 区 ， 落 在 哪个 PAGE 页 面 就 把 其 对 应 的 BIT 位 置 为 1。 
当 整 个 位 图 索引 构建 完毕 后 ， 按 照 从 前 到 后 的 顺序 扫描 表 本 体 取 数据 ， 这 样 可 以 保证 表 
本 体 上 的 每 个 PAGE 只 需 读 取 一 人 帝 ， 相 比 不 使 用 位 图 堆 扫 描 技 术 的 扫描 方法 大 大 节省 了 
IO。 详 情 可 参见 https://dba.stackexchange.com/questions/119386/understanding-bitmap- 
heap-scan-and-bitmap-index-scan 。 译 者 注 


9.4.3 ”并 行 化 关联 操作 


关联 操作 也 可 以 实现 并 行 化 。 在 PostgreSQL 9.6 中 ， 艇 套 循环 关联 
和 散 列 关联 这 两 种 关联 模式 都 是 可 并 行 化 的 。 


在 肉 套 循环 关联 过 程 中 ， 每 个 worker 只 需 对 分 配给 它 的 数据 子 集 
做 关联 运算 ， 关 联 对 象 是 所 有 worker 共享 的 被 关联 表 。 


在 散 列 关联 过 程 中 ， 每 个 worker 会 先 构造 一 份 全 量 的 散 列 表 ， 然 
后 拿 自己 负责 的 那 部 分 其 他 表 数 据 和 这 个 全 量 散 列表 做 关联 条 件 判 
定 。 由 于 每 个 worker 都 需要 构建 一 个 全 量 的 散 列 表 ， 而 它 目 己 不 
可 能 用 到 全 量 的 散 列 数据 ， 因 此 显然 worker 之 间 有 很 多 元 余 运 
算 。 所 以 ， 如 果 创 建 散 列 表 是 个 很 昂贵 的 操作 ， 并 行 化 的 散 列 关联 
的 速度 会 比 非 并 行 化 关联 操作 慢 。 

























































































PostgreSQL 10 中 支持 merge 关联 的 并 行 化 。merge 关联 与 散 列 关联 
存在 类 似 的 问题 ， 即 每 个 worker 都 要 对 关联 操作 某 一 侧 的 表 进 行 
完全 处 理 ， 因 此 worker 之 间 必 然 会 存在 重复 运算 。 





01. 9.5 “人工 干预 规划 需 生 成 执行 计划 的 过 程 


规划 需 生 成 执行 计划 的 行为 会 受到 多 方面 因素 的 影响 ， 有 共 体 包括 : 
征 售 有 合适 的 索引 、 执 行 成 本 设置 、 执 行 策略 设置 以 及 数据 如 何 分 
布 等 。 本 市 将 介绍 多 种 可 以 对 规划 器 施加 入 工 干 预 的 方法 ， 通 过 这 
些 方法 可 以 得 到 更 合理 的 执行 计划 。 


9.5.1 策略 设置 


与 某 些 其 他 数据 库 产品 不 同 的 是 ，PostgreSQL 碍 询 规划 器 不 接受 索 
引 提示 ， 但 你 可 以 逐个 得 询 或 永久 茶 用 各 种 策略 设置 《比如 全 表 扫 
描 、 位 图 扫描 、 散 列 聚 合 、 散 列 关 联 等 都 是 一 种 执行 朱 略 ， 都 有 相 
应 的 策略 设置 ) ， 以 阻止 规划 器 选 出 某 些 效率 较 低 的 执行 条 略 。 
PostgreSQL 官方 手册 中 的 “规划 器 方法 配置 ”一 节 中 介绍 了 所 有 规划 
强人 优化 设置 。 默 认 情 况 下 ， 所 有 策略 设置 都 已 启用， 此 时 规划 右 因 
为 不 受 什么 约束 所 以 灵活 性 是 最 大 的 。 如 果 你 对 要 查询 的 数据 的 特 
点 预先 有 了 一 定 了 解 ， 那 么 就 可 以 有 针对 性 地 茶 用 茶 些 策略 来 优化 
语句 的 执行 路 径 。 不 过 请 注意 ， 即 使 你 设置 了 某 种 策略 为 禁用 ， 也 
并 不 意味 痢 规 划 器 融 一 定 不 会 使 用 该 策略 。 规 划 需 仅 将 这 些 设 置 当 
作用 户 的 建议 ， 节 终 的 决定 权 还 是 在 规划 需 。 


我 们 有 时 候 会 将 enable_nestloop 〈 花 套 循 环 ) 和 
enable_seqscan 《全 表 扫 描 ) 这 两 个 设置 设 为 “禁用 ”， 因 为 这 两 
种 执行 策略 在 大 多 数 情况 下 的 效率 是 很 低 的 ， 当 然 并 不 是 所 有 情况 
下 都 这 样 。 你 可 以 禁用 这 两 种 执行 策略 ， 但 规划 器 在 没有 别 的 选择 
时 还 是 可 能 会 使 用 的 ， 因 为 无 论 如 何 至 少 应 该 保证 语句 可 以 正常 执 
行 。 如 果 你 在 执行 计划 中 看 到 了 全 表 扫 描 和 骨 套 循环 这 两 种 执行 策 
略 ， 那 么 建议 核查 一 下 到 底 是 因为 规划 器 已 经 找 不 到 更 好 的 集 略 所 
以 不 得 不 用 ， 还 是 规划 器 选择 了 错误 的 策略 。 一 个 快速 鉴别 的 办 法 
是 先 禁 用 该 策略 ， 然 后 对 禁用 前 后 的 执行 计划 进行 比较 。 如 果 禁 用 
前 的 执行 计划 中 使 用 了 该 策略 但 禁用 后 却 不 使 用 了 ， 那 么 再 进一步 
比较 一 下 这 两 种 情况 下 执行 计划 的 真实 成 本 ， 就 可 以 看 出 选择 该 策 
略 到 底 是 快 了 还 是 慢 了 。 


9.5.2 ”你 的 索引 被 用 到 了 吗 









































如 果 规 划 器 选择 了 全 表 扫 描 集 略 ， 就 意味 着 后 续 执 行 过 程 中 会 从 头 
到 尾 读 取 表 中 的 每 一 条 记录 。 规 划 器 会 在 以 下 两 种 情况 下 选择 全 表 
扫描 策略 : 一 种 情况 是 表 上 没有 合适 的 索引 能 满足 查询 条 件 的 要 
求 ; 另外 一 种 是 规划 峰 认 为 通过 色 引 来 查找 数据 的 成 本 要 高 于 全 表 
扫描 。 如 果 你 禁用 了 全 表 扫 摘 策略 ， 但 规划 器 依然 选择 了 这 人 么 干 ， 
这 就 说 明 表 上 无 索引 或 者 虽然 有 索引 但 不 适用 此 语句 的 查询 条 件 。 
有 两 个 错误 是 大 家 经 常会 犯 的 ， 一 个 是 表 上 缺少 必要 的 索引 ， 另 一 
个 是 索引 建 得 不 对 而 导致 查询 语句 用 不 上 。 通 过 查询 
pg_stat user indexes 和 pg _stat user tables 这 两 个 视图 可 
以 很 方便 地 得 知 你 的 索引 是 否 被 用 上 了 。 如 需 了 解 哪些 语句 执行 得 
慢 ， 请 安装 pg_stat_statements 扩展 包 ， 其 用 法 在 9.2 节 中 已 经 
介绍 过 。 


下 面 通 过 若干 例子 来 说 明 。 还 是 使 用 示例 7-22 中 创建 过 的 表 ， 我 
们 在 该 表 的 数组 列 fact_subcats 上 建立 一 个 GIN 索引 ，GIN 类 
型 的 索引 是 为 数 不 多 的 能 够 支持 数组 类 型 的 索引 。 语 句 如 下 : 


CREATE INDEX idx lu fact types ON census.lu fact types USING gin (fac 


接 下 来 执行 一 个 查询 语句 以 验证 所 建 索 引 是 否 有 效 ， 碍 询 条 件 
为 : fact_subcats 数组 列 中 要 包含 “White alone” 和 “Asian 
alone” 这 两 个 元 夫 。 昌 然 全 表 扫 描 集 略 的 默认 设置 就 是 “局 用 ”， 但 
0 示例 9-15 显示 了 该 语句 的 执 
行 计 划 。 


示例 9-15 ”允许 规划 需 选 择 全 表 扫 描 策 略 























set enable seqscan = true; 

EXPLAIN(ANALYZE) 

SELECT * 

FROM census.lu fact types 

WHERE fact subcats && '{White alone, Black alone}'::varchar[]; 


Seq Scan on lu fact types 
(cost=0.060..2.85 rows=2 width=266) 
(actual time=0.066..6.676 rows=2 loops=1) 
Filter: (fact subcats 
&& '{"White alone","Black alone"}'::character varying[]) 


Rows Removed by Filter: 66 
Planning time: 6.182 ms 
Execution time: 86.168 ms 





请 注意 ， 在 局 用 全 表 扫 描 集 略 的 情况 下 ， 规 划 器 忽略 了 索引 而 选用 
了 全 表 扫 描 朱 略 。 这 可 能 是 因为 表 的 规模 很 小 或 者 是 因为 案 引 不 适 
用 于 本 语句 中 的 碍 询 条 件 。 在 示例 9-16 中 ， 我 们 执行 的 语句 相 
同 ， 但 通过 茶 用 全 表 扫 描 策 略 来 强迫 规划 需 使 用 了 索引 。 


示例 9-16 茜 用 全 表 扫 描 全 略 ， 强 行 要 求 使 用 索引 





set enable seqscan = false; 
EXPLAIN (ANALYZE) 
SELECT * 
FROM census.1lu fact types 
WHERE fact subcats && '{White alone, Black alone}'::varchar[]; 
Bitmap Heap Scan on lu fact types 
(cost=12.02..14.604 rows=2 width=266) 
(actual time=0.058. .0.658 rows=2 loops=1) 
Recheck Cond: (fact_subcats 
&& '{"White alone","Black alone"}'::character varying[]) 
Heap Blocks: exact=1 
-> Bitmap Index Scan on idx lu fact types 
(cost=6.60..12.02 rows=2 width=08) 
(actual time=0.6048..0.6048 rows=2 loops=1) 
Index Cond: (fact subcats 
&& '{"White alone","Black alone"}'::character varying[]) 
Planning time: 6.236 ms 
Execution time: 8.119 ms 








通过 该 执行 计划 可 以 看 到 ， 索 引 建 得 没 问 题 ， 是 可 以 使 用 的 ， 却 使 
得 整个 查询 的 执行 耗 时 更 长 ， 因 为 基于 索引 的 查询 成 本 要 比 基 于 全 
表 扫 描 的 成 本 高 。 因 此 ， 正 第 情况 下 规划 器 将 选择 使 用 全 表 扫 擅 策 
0 
询 策 略 。 


ee 假设 我 们 需要 执行 如 下 这 样 一 个 奉 
WW; 











SELECT * FROM census.lu fact types WHERE “White alone' = ANY(fact_subc 


我 们 会 看 到 ， 不 管 将 enable_seqscan 设 为 局 用 还 是 禁用 ， 规 划 咒 
总 是 会 选择 执行 全 表 扫 描 ， 因 为 此 时 索引 无 法 满足 查询 条 件 的 需 

要 。 因 此 ， 建 立 合 适 的 索引 并 编写 正确 的 、 能 用 上 索引 的 SQL 是 

很 重要 的 。 保 证 了 这 些 以 后 ， 后 续 的 工作 就 是 多 试验 几 次 ， 以 确保 
生成 的 执行 计划 是 最 优 的 。 


9.5.3” 表 的 统计 信息 


你 可 能 会 认为 规划 器 神秘 又 强大 ， 但 无 论 如 何 规 划 器 并 不 是 神 ， 它 
只 是 遵循 一 套 设 定好 的 算法 来 生成 执行 计划 。 关 于 规划 器 算法 的 内 
容 细 市 远 远 超 出 了 本 书 的 范畴 ， 在 此 不 做 讨论 。 虽 然 规划 器 的 算法 
严重 依赖 于 表 的 统计 信息 ， 但 规划 咒 不 会 在 每 次 生成 执行 计划 之 前 
临时 扫描 所 有 的 相关 表 以 获取 其 统计 信息 ， 因 为 如 果 那 么 做 的 话 任 
何 语句 的 执行 都 将 巨 慢 无 比 ， 完 全 没有 执行 效率 可 言 ， 所 以 规划 器 
会 依赖 预先 搜集 好 的 表 统 计 信息 。 


因此 ， 要 想 规 划 器 能 够 做 出 准确 的 决定 ， 及 时 准确 地 更 新 表 统 计 信 
息 是 至 关 重 要 的 。 如 果 统 计 信息 与 实际 情况 相差 太 大 ， 规 划 器 很 可 
能 会 常常 推导 出 错误 的 执行 计划 ， 最 差 的 情况 就 是 错误 地 选择 了 全 
表 扫 描 策略 。 一 般 来 说 ， 平 均一 张 表 只 有 20% 的 记录 采样 率 ， 统 
计 信 息 会 基于 这 些 参 与 采样 的 记录 来 生成 。 对 于 非常 大 的 表 来 说 ， 
采样 率 可 能 更 低 。 你 可 以 通过 设置 STATISTICS 值 来 修改 在 每 一 列 
上 采样 的 行 数 。 


通过 查询 pg_stats 表 ， 可 以 了 解 到 规划 需 剔 除了 哪些 统计 信息 以 
及 使 用 了 哪些 统计 信息 ， 碍 询 方法 如 示例 9-17 所 示 。 


示例 9-17 ”数据 分 布 直方 图 






































SELECT 
attname As colname， 
n_distinct， 
most_common vals AS common_Vvals， 
most common freqs As dist freq 
FROM pg_ stats 


WHERE tablename = 'facts' 
ORDER BY schemaname, tablename, attname; 


colname | n_distinct | common vals | dist freq 


{135,113... {60.0157,0.0156333,... 

{60.600,... {8.1845,9.9579333,8.656 

{25625699368. . . {8.66116667,8.66166667， 

{86.668,1.698,2...| {60.2116,0.0681333,0... 
2 | {2611,2610} {0.748933,0.251067} 





pg_stats 表 给 出 了 表 中 指定 列 的 值 域 分 布 图 ， 规 划 器 会 根据 此 信 
恩 制 订 相 应 的 执行 计划 。 系 统 后 台 会 有 一 个 进程 持续 不 断 地 更 新 
pg_stats 表 。 当 表 中 插入 或 者 删除 大 量 数据 后 ， 你 应 该 手动 执行 
VACUUM ANALYZE 来 更 新 表 的 统计 信息 。VACCUM 指示 将 已 删除 的 
记录 永久 性 地 从 表 中 移 除 ，ANALYZE 指示 更 新 表 的 统计 信息 。 


对 于 经 常 参与 关联 查询 并 且 在 WHERE 子 句 中 频繁 使 用 的 列 ， 应 该 
考虑 提升 采样 的 行 数 。 所 需 执 行 的 代码 如 下 : 


ALTER TABLE census.facts ALTER COLUMN fact type id SET STATISTICS 1666 


PostgreSQL 10 中 新 增 了 对 于 多 字段 统计 信息 的 文 持 ， 相 应 的 语法 
是 CREATE STATISTICS 。 该 特性 使 得 用 户 能 够 针对 多 个 字段 的 组 
合 来 创建 统计 对 象 。 如 果 表 中 某 些 字段 的 值 之 间 存 在 关联 ， 那 么 多 
字段 统计 信息 就 能 发 挥 作 用 。 比 如 某 些 数据 仅 适 用 于 某 一 特定 年 

份 ， 而 不 适用 于 其 他 年 份 。 假 设 这 两 个 字段 分 别 为 fact_type id 
1 
列 9-18 所 示 。 


示例 9-18 ”多 字段 统计 信息 











CREATE STATISTICS census .stats facts type yr dep dist (dependencies，n 
ON fact type id, yr FROM census .facts ; 


ANALYZE census .facts ; 





| | 


CREATE STATISTICS 语句 中 必须 指定 同一 张 表 中 的 两 个 或 者 多 个 
字段 。 示 例 9-18 中 为 census .facts 表 中 的 fact_type_ id 和 yr 
字段 创建 了 统计 信息 。 另 外 ， 建 议 为 统计 信息 起 个 名 字 ， 当 然 这 个 
名 字 其 实 是 可 选 的 。 如 果 你 在 起 名 时 带 了 schema 的 名 字 (上 例 中 
census.stats facts type_yr_dep_dist 里 面 的 census 就 是 
schema 的 名 字 ) ， 那 么 该 统计 信息 默认 会 被 创建 到 该 schema 中 ， 
不 指定 则 会 被 创建 到 默认 schema 中 。 


你 可 以 采集 两 种 统计 信息 ， 创 建 时 必须 至 少 指定 其 中 一 种 。 


。 第 一 种 是 数据 依赖 统计 信息 ， 记 录 了 不 同 字 段 间 值 的 依赖 性 。 
例如 ， 只 有 当 城 市 名 为 波士顿 时 才 会 出 现 邮政 编码 02109。 只 
有 当 优 化 器 对 带 等 值 判定 的 语句 进行 优化 时 ， 数 据 依赖 统计 信 
息 才 能 发 挥 作 用 ， 例 如 这 种 条 件 : city = 'Boston' and 
zip = “02169 ' 。 

。 第 二 种 是 ndistinct 统计 信息 ， 记 录 了 不 同 字 段 值 一 起 出 现 
的 频率 ， 并 且 会 针对 字段 列表 中 每 种 排列 组 合 都 进行 统 
计 。ndistinct 统计 信息 专用 于 提升 GROUP BY 操作 的 效率 ， 
而 且 仅 当 GROUP BY 子 句 中 的 字段 全 部 落 在 统计 信息 所 包含 的 
字段 列表 中 时 ， 才 能 发 挥 作用 。 


CREATE STATISTICS 所 创建 的 统计 信息 都 存在 
pg_statistic_ext 表 中 ， 可 以 使 用 DROP STATISTICS 命令 删 
除 。 与 其 他 所 有 统计 信息 类 似 ， 该 类 统计 信息 是 在 ANALYZE 命令 
执行 期 间 计 算出 来 的 ， 而 ANALYZE 操作 是 由 系统 的 自动 清理 及 分 
析 进 程 〈 官 方 名 称 为 autovacuum 进程 ) 自动 执行 的 。 建 议 在 建 完 
表 之 后 立即 对 其 运行 一 次 ANALYZE 命令 ， 这 样 该 表 的 统计 信息 立 
即 就 可 以 被 优化 器 用 到 。 


9.5.4 ”磁盘 页 的 随机 访问 成 本 以 及 磁盘 驱动 右 的 性 能 


为 一 个 会 影响 规划 器 执行 策略 选择 的 设置 是 random_page_cost 

(随机 页 访问 成 本 比 ， 简 称 RPC) 比率 ， 它 表示 在 磁盘 上 顺序 读 取 
和 随机 读 取 同一 条 记录 的 性 能 之 比 。 一 般 来 说 ， 物 理 磁 盘 速 度 越 快 
(一 般 也 会 越 贵 ) ， 该 比率 就 会 越 小 。RPC 的 默认 值 是 4， 该 值 适 
用 于 目前 市 面 上 的 大 多 数 机 械 硬 盘 。 但 如 果 使 用 的 是 固态 硬盘 或 者 














SAN 存储 系统 ， 有 必要 对 此 值 进行 调整 。 


你 可 以 在 database、 服 务 器 、 表 空间 这 三 个 级 别 设置 RPC 比率 。 如 
果 要 在 服务 右 级 别 设置 该 比率 ， 直 接 在 postgresql.conf 文件 中 设置 
即 可 。 如 果 同 一 台数 据 库 服务 器 上 使 用 了 不 同类 型 的 硬盘 ， 并 且 不 
同 的 表 空 间 落 在 不 同 的 硬盘 上 ， 那 么 可 以 在 表 空 间 级 别 设置 RPC 
比率 ， 语 法 如 下 所 示 。 


ALTER TABLESPACE pg default SET (random page_ cost=2); 


有 关 该 设置 的 详细 信息 ， 请 参考 “Random Page Cost Revisited” 这 篇 
博文 。 这 篇 文章 建议 采用 以 下 设置 。 


。 高 端 NAS/SAN 存储 : 2.5 或 者 

e。 亚 马 进 EBS 和 Heroku 云 平 台 : 2 

。iSCSI 和 其 他 普通 SAN 存储 : 但 可 能 变化 比较 大 ， 需 要 
按照 实际 情况 设 定 

。 固态 硬盘 : 2.0 至 2.5 

。NvRAM (也 叫 NAND) : 1.5 








01. 9.6 ”数据 缓存 机 制 


如 果 你 之 前 执行 过 一 个 复杂 且 耗 时 较 长 的 查询 ， 那 么 后 续 再 次 执行 
此 查询 时 会 友 现 快 了 很 多 ， 这 是 因为 系统 的 数据 缓存 机 制 发 挥 了 作 
用 。 如 有 果 同 一 个 得 询 语句 按 顺 序 多 次 执行 ， 而 且 这 些 得 询 涉 及 的 撒 
层 数 据 并 没有 发 生变 化 ， 那 么 不 管 这 些 语句 是 被 同一 个 用 户 还 是 多 
个 用 户 执 行 ， 最 终 得 到 的 结果 都 应 该 是 一 样 的 。 只 要 内 存 中 还 有 空 
间 可 用 于 缓存 数据 ， 那 么 规划 需 就 可 能 会 跳 过 生成 执行 计划 和 从 磁 
盘 读 取 表 数据 的 步 又， 直接 从 缓存 中 获取 数据 。 如 果 语 句 中 使 用 了 
CTE 表达 式 和 结果 不 变 式 函 数 〈 这 类 函数 的 运算 结果 不 依赖 外 部 数 
据 ， 仅 依赖 输入 的 数据 ， 也 惑 是 次 固定 的 输入 一 定 能 得 到 固定 的 输 
出 ) ， 那 么 系统 会 更 加 倾 问 于 进行 结果 集 缓 存 。 


那么 如 何 碍 看 系统 中 缓存 了 哪些 数据 呢 ? 可 以 通过 安装 
pg_buffercache 扩展 包 来 查看 。 


CREATE EXTENSION pg_buffercache ; 


示例 9-19 ”查看 表 数 据 是 人 否 已 被 缓存 














C.relname, 
COUNT(CASE WHEN B.isdirty THEN 1 ELSE NULL END) As dirty_buffers， 
COUNT(*) As num buffers 
FROM 
pg_class AS C INNER JOIN 


pg_buffercache B ON C.relfilenode = B.relfilenode INNER JOIN 
pg_database D ON B.reldatabase = D.oid AND D.datname = current dat 
WHERE C.relname IN ('facts',']lu fact types') 
GROUP BY C.relname; 





示例 9-19 中 的 语句 查 出 了 facts 和 lu_fact_types 这 两 张 表 中 


被 缓存 的 页 数 。 需 要 先 实 际 执 行 一 个 SQL 碍 询 语句 ， 才 会 有 数据 
被 真正 缓存 下 来 ， 此 后 示例 9-19 中 的 语句 才能 有 结果 。 我 们 先 执 
行 一 下 下 面 这 个 语句 。 








SELECT T.fact subcats[2], COUNT(*) As num fact 
FROM 


census.facts As F 

INNER JOIN 

census.lu fact types AS T ON F.fact type id = T.fact type_id 
GROUP BY T.fact subcats[2]; 





当 再 次 执行 上 述 语句 时 ， 你 应 该 可 以 看 到 至 少 10% 的 性 能 提升 ， 
并 且 示 例 9-19 的 查询 可 以 看 到 类 似 以 下 的 结果 。 





用 于 绥 存 数据 的 内 存 大 小 是 可 指定 的 ， 该 值 越 大 ， 能 缓存 的 数据 就 
越 多 。postgresql.conf 中 的 shared_buffers 就 是 用 于 设置 此 值 








的 ， 但 不 应 设 得 过 大 ， 人 否则 会 耗费 过 多 时 间 去 扫描 缓 存 ， 反 而 降低 
了 性 能 。 


由 于 如 今 的 物理 内 存 已 经 极其 廉价 ， 因 此 一 般 不 会 再 出 现 内 存 不 够 
的 情况 。 基 于 这 一 点 ， 我 们 很 容易 束 想 到 ， 可 以 将 一 些 常 用 的 表 预 
先 缓存 到 内 存 中 ， 这 样 就 可 以 提高 后 续 访 问 效 紊 。 有 一 个 名 为 
pg_prewarm 的 扩展 包 可 以 用 于 实现 此 功能 。pg_prewarnm 会 将 指 
定 的 和 常用 表 预 加 载 到 缓存 中 ， 此 后 不 管 该 表 是 首次 被 用 户 访 问 还 是 
非 首 次 访问 ， 响 应 速度 总 是 很 快 。 








01. 


第 10 章 复制 与 外 部 数据 


PostgreSQL 有 很 多 方法 可 以 实现 与 外 部 服务 器 或 数据 源 之 间 的 数据 
共享 。 第 一 种 就 是 PostgreSQL 自 带 的 复制 功能 ， 通 过 该 功能 可 以 
在 另外 一 人 台 服 务 器 上 创建 出 当前 服务 器 的 一 个 镜像 。 第 二 种 方法 是 
使 用 第 三 方 插件 ， 其 中 许多 插件 可 以 免费 使 用 ， 并 且 其 可 靠 性 也 是 
久 经 考验 的 。 第 三 种 方法 是 使 用 外 部 数据 封装 器 (foreign data 
wrapper，FDW) 。FDW 文 持 大 量 的 外 部 数据 源 ， 从 9.3 版 开始 ， 
有 些 FDW 也 开始 支持 对 外 部 数据 进行 修改 ， 包 括 postgres_fdw 
、hadoop_fdw 和 ogr_fdw (详情 请 参见 10.3.4 节 ) 。 








01. 10.1 复制 功能 概览 


很 多 情况 下 我 们 都 需要 使 用 数据 库 复 制 功 能 ， 但 不 管 共 体 场景 如 

何 ， 其 根本 原因 都 可 以 归结 为 两 个 :提升 数据 的 可 用 性 和 可 扩展 

性 。 确 保 可 用 性 的 手段 是 提供 一 合 元 余 的 备用 服务 器 ， 如 果 主 服务 
需 宕 机 了 ， 备 用 服务 需 应 立即 接管 并 继续 提供 服务 。 对 于 规模 较 小 
的 数据 库 来 说 ， 要 达到 此 目标 只 需要 保证 你 有 为 一 台 备用 的 物理 服 
务 右 ， 并 将 数据 库 恢复 到 该 服务 器 上 即 可 。 但 对 于 规模 很 大 的 数据 
库 〈 数 据 量 为 TB 级 别 ) 来 说 ， 恢 复 过 程 本 里 可 能 需要 好 几 个 小 时 
甚至 儿 天 ， 而 且 在 此 过 程 中 系统 无 法 对 外 提供 服务 。 为 尽量 减少 服 
务 中 断 时 间 ， 你 就 需要 使 用 复制 功能 。 


我 们 需要 复制 功能 的 另 一 个 原因 是 可 扩展 性 诉求 。 假 设 你 开设 了 一 
个 网 站 ， 做 着 饲养 并 出 售 象 购 的 买卖 。 做 了 几 年 之 后 ， 你 已 经 拥有 
了 几 千 只 象 购 。 全 世界 的 客户 都 涌 到 你 的 网 站 来 查看 并 购买 ， 结 宋 
由 于 流量 过 大 导致 网 站 过 载 并 无 法 正常 处 理 请 求 ， 那 么 这 时 候 就 需 
要 复制 功能 出 马 了 。 只 需 设 定 一 个 只 读 的 从 属 服务 器 作为 主 服 务 器 
的 镜像 ， 然 后 就 可 以 把 海量 的 该 请求 分 流 到 从 属 服务 右上， 只 有 当 
买 家 真正 下 单 时 才 需 要 到 主 服务 器 上 执行 操作 。 


10.1.1 复制 功能 涉及 的 术语 
在 深入 探讨 复制 功能 之 前 ， 先 介绍 一 下 相关 术语 。 
主 服务 器 

主 服务 器 是 作为 要 复制 数据 的 源头 的 数据 库 服务 器 ， 所 有 更 新 
都 在 其 上 发 生 。 使 用 PostgreSQL 的 内 置 复制 功能 时 ， 仅 允许 使 用 
一 台 主 服务 器 。 己 有 计划 要 文 持 多 主 服务 器 复制 方案 ， 请 关注 将 来 
的 版 本 。publisher (发 布 者 〉 这 个 词 你 可 能 经 常会 看 到 ， 其 含义 是 
数据 提供 方 。 在 PostgreSQL 10 内 置 的 逻辑 复制 功能 
publisher/subscriber (发 布 者 /订阅 者 ) 这 对 术语 会 频频 出 现 。 
从 属 服务 器 


从 属 服务 器 使 用 复制 的 数据 并 提供 主 服务 器 的 副本 。 尺 官 也 有 















































人 谈 到 一 些 听 起 来 更 悦耳 的 术语 《比如 订阅 者 、 代 理 等 ) ， 但 从 属 
服务 器 这 个 名 称 仍 是 最 贴切 的 。PostgreSQL 的 内 置 复制 功能 目前 仅 
文 持 只 该 从 属 服务 器 。 


预 写 日 志 (write-ahead log，WAL ) 


WAL 就 是 记录 所 有 已 完成 事务 信息 的 日 志文 件 ， 在 其 他 数据 
库 产品 中 一 般 称 为 事务 日 志 。 为 了 支持 复制 功能 ，PostgreSQL 将 主 
服务 器 的 WAL 日 志向 从 属 服务 器 开放 ， 然 后 从 属 服务 器 持续 地 将 
这 坚 昌 志 取 到 本 地 ， 然 后 将 其 中 记 示 的 事务 重演 一 这 ， 这 样 就 实现 
了 数据 同步 。 


同步 复制 


在 事务 提交 阶段 ，PostgreSQL 需 保证 已 经 将 此 事务 中 所 做 的 修 
改 成 功 同步 到 synchronous_stand_names 参数 中 所 列 出 的 至 少 一 
个 从 属 服务 器 上 ， 然 后 才能 同 用 户 反 馈 事 务 提交 成 功 。 在 
PostgreSQL 9.6 之 前 ， 只 需 任 何 一 个 同步 服务 器 反馈 成 功 ， 事 务 束 
算 成 功 。 在 PostgreSQL 9.6 以 及 之 后 的 版 本 中 支持 了 一 个 增强 功 
能 ， 即 可 以 要 求 至 少 N 个 从 属 服务 器 反馈 成 功 后 整个 事务 才 算 成 
功 ， 这 个 N 可 以 在 postgresql.conf 的 
synchronous_standby_names 参数 中 进行 配置 。PostgreSQL 10 
更 进一步 支持 了 FIRST 和 ANY 这 两 个 关键 字 ， 分 别 代表 “只 需 第 一 
个 从 属 服务 器 反馈 成 功 ” 和 “只 和 雷 任 何 一 个 从 属 服务 器 反馈 成 功 ”， 

这 两 个 关键 字 也 是 在 synchronous_standby_names 参数 中 进行 

配置 。 如 果 不 配 置 该 项 ， 则 默认 值 为 FIRST ， 即 只 需 第 一 个 从 属 

服务 器 反馈 成 功 ，PostgreSQL 9.6 在 默认 情况 下 的 处 理 策 略 也 是 如 
此 


























异步 复制 


在 事务 提交 阶段 ， 主 服务 器 上 提交 成 功 就 算 成 功 ， 不 需要 等 待 
从 属 服务 器 的 数据 更 新 成 功 。 当 从 属 服务 器 位 于 远 端 时 该 模式 就 比 
较 有 用 了 ， 因 为 可 以 避免 网 络 延迟 的 影响 。 但 有 利 必 有 弊 ， 该 模式 
下 从 属 服务 器 的 数据 更 新 不 够 及 时 ， 与 主 服 务 器 之 间 会 有 一 些 延 
迟 。 如 果 主 从 服务 器 之 间 的 延迟 很 严重 ， 以 至 于 主 从 之 间 的 差距 大 
到 主 服务 占 上 的 WAL 事务 日 志 还 没有 传输 到 从 属 服务 器 就 已 经 被 
清理 掉 ， 那 么 此 时 其 实 复制 环境 已 经 被 破坏 且 无 法 恢复 ， 从 属 服务 





髓 需要 基于 主 服务 圳 的 数据 重新 初始 化 一 过 。 


为 尽量 降低 出 现 上 述 问 题 的 风险 ，PostgreSQL 9.4 中 引入 了 复 
制 槽 (replication slot) 的 概念 。 所 谓 “ 复 制 槽 ”是 指 主 从 服务 喜之 间 
的 一 种 掉 约 ， 该 契约 保证 了 在 从 属 服务 器 消费 到 相应 的 WAL 日 志 
之 前 ， 这 部 分 WAL 日 志 不 会 被 主 服务 器 删除 。 这 么 做 又 会 导致 另 
一 个 风险 ， 束 是 如 果 某 个 持 有 “复制 槽 ?的 从 属 服务 器 发 生 故 障 或 者 
与 主 服 务 器 之 间 通 信 中 断 ， 那 么 主 服 务 器 上 就 不 得 不 永久 保留 那些 
古老 的 WAL 日志 (因为 不 确定 从 属 服务 器 是 否 已 经 消费 这 部 分 
、 所 以 不 能 删 ) ， 从 而 导致 磁盘 空间 被 占 满 ， 最 后 导致 服务 


流 陈 复制 


流 式 复制 模式 下 ，WAL 日 志 并 不 是 通过 直接 复制 文件 的 方式 
从 主 服务 器 传递 到 从 属 服务 器 ， 而 是 通过 基于 PostgreSQL 内 部 协 
议 的 消息 来 传递 的 。 


级 联 复制 


一 个 从 属 服务 器 可 以 把 WAL 日 志 传递 给 另 一 个 从 属 服务 器 ， 
而 不 需要 所 有 的 从 属 服务 器 都 从 主 服务 器 取 WAL 日 志 ， 这 进一步 
减轻 了 主 服务 器 的 负担 。 这 种 模式 下 ， 有 的 从 属 服 务 品 可 以 作为 同 
步 的 数据 源 ， 从 而 继续 向 别 的 从 属 服务 器 传播 WAL 数据 ， 从 这 个 
角度 看 ， 其 作用 类 似 于 主 服 务 器 。 注 意 ， 这 种 扮演 着 “WAL 日 志 二 
传 手 ”角色 的 从 属 服务 器 是 只 读 的 ， 它 们 也 被 称 为 级 联 从 属 服务 器 








逻辑 复制 


这 是 PostgreSQL 10 新 支持 的 复制 功能 ， 通 过 该 功能 可 以 实现 
仪 复制 车 干 特定 的 表 ， 而 无 须 复 制 整 个 PostgreSQL 服务 器 的 所 有 
数据 ， 从 而 大 大 增加 了 复制 的 灵活 性 。 该 功能 的 实现 依赖 于 一 个 名 
为 逻辑 解码 (logic decoding) 的 机 制 ， 该 机 制 可 以 将 表 数 据 的 变 
更 历史 从 WAL 日 志 中 以 一 种 易于 理解 的 格式 解析 出 来 ， 过 程 中 无 
须 关 注 数 据 库 WAL 日 志 格 式 的 内 部 实现 细节 。 逻 辑 解码 机 制 从 
PostgreSQL 9.4 开始 就 已 支持 ， 某 些 扩 展 包 基 于 它 实 现 了 审计 和 复 
制 功 能 。 使 用 逻辑 复制 功能 时 ， 需 要 用 到 CREATE PUBLICATION 








和 CREATE SUBSCRIPTION 这 两 个 DDL 语法 ， 前 者 表示 哪些 表 要 
进行 复制 ， 后 者 表示 哪些 PostgreSQL 服务 器 上 的 哪些 database 要 
订阅 数据 。 


另外 请 注意 ， 要 使 用 该 功能 ， 需 要 把 wal_level 参数 的 值 设 
置 为 logical 。 


具体 的 使 用 示例 可 以 参考 “Logical Replication in PostgreSQL 
10” 这 篇 博客 文章 。 


重新 选 主 


重新 选 主 是 指 从 所 有 的 从 属 服务 器 中 选择 一 个 并 将 其 身份 提升 
为 主 服 务 器 的 过 程 。PostgreSQL 9.3 引入 了 基于 流 消息 复制 的 选 主 
机 制 ， 该 模式 下 选 主 时 仅 依 靠 流 消 息 ， 而 不 再 需要 访问 WAL 日志 
文件 ， 同 时 从 属 服务 器 也 不 需要 经 历 一 次 重新 复制 过 程 。 直 到 9.4 
版 为 止 ， 重 新 选 主 还 会 要 求 整 个 数据 库 服务 重启 一 次 ， 将 来 的 版 本 
中 可 能 会 改进 这 一 点 。 


PostgreSQL 的 复制 机 制 会 复制 所 有 事务 性 的 变更 ， 即 在 事务 内 发 生 
的 一 切 都 可 以 被 复制 到 从 节点 。PostgreSQL 中 所 有 的 DDL 操作 都 
是 事务 性 的 ， 因 此 建 表 、 建 视图 、 安 装 扩展 包 之 类 的 操作 都 是 可 被 
复制 的 。 注 意 非 日 志 (unlogged) 表 上 的 插入 、 更 新 和 删除 操作 是 
不 记录 WAL 日 志 的 ， 因 此 这 些 操作 不 会 被 复制 。 前 面 说 过 ， 安 装 
扩展 包 的 行为 会 被 复制 ， 所 以 当 在 主 节点 上 安装 扩展 包 时 ， 要 确保 
从 节点 上 有 扩展 包 的 安装 包 ， 而 且 版 本 号 需要 和 主 节 点 一 致 ， 否 则 
在 主 节点 上 执行 CREATE EXTENSION 操作 会 失败 。 


10.1.2 复制 机 制 的 演进 


PostgreSQL 的 复制 机 制 本 质 上 是 靠 WAL 日 志 在 主 从 节点 间 传 递 来 
实现 的 。 流 式 复 制 要 求 从 节点 的 操作 系统 以 及 CPU 位 数 (32/64 
位 ) 必须 和 主 节 点 相同 。 虽 然 官方 并 不 强制 要 求 主 备 节 点 上 的 
PostgreSQL 软件 一 直 精 确 到 第 三 位 的 小 版 本 号 都 完全 相同 ， 但 我 们 
建议 保证 主 备 PostgreSQL 的 版 本 号 完全 相同 。 如 果 由 于 某 些 原因 
Ry 建议 确保 从 节点 的 PostgreSQL 小 版 本 号 高 于 主 
i 





























对 复制 机 制 的 支持 在 以 下 PostgreSQL 版 本 中 不 断 演 进 。 


。 9.4 版 中 新 增 了 对 复制 模 的 支持。 所谓 “复制 槽 ?是 指 主 从 服务 
器 之 间 的 一 种 契约 ， 该 契约 保证 了 在 从 属 服务 器 尚未 消费 到 相 
应 的 WAL 日 志 之 前 ， 这 部 分 WAL 日 志 不 会 被 主 服 务 器 删 
除 。 

。 9.5 版 中 引入 了 若干 用 于 监控 复制 过 程 的 函数 ， 详 情 请 参考 官 
方 手册 中 的 “复制 进度 跟踪 ”部 分 。 

。 9.6 版 中 支持 了 在 同步 模式 下 设置 多 个 同步 备 节 点 的 能 力 ， 日 

的 是 为 了 提升 可 靠 性 。 

PostgreSQL 10 中 支持 了 原生 的 逻辑 复制 功能 ， 该 功能 使 得 仅 

复制 指定 的 若干 张 表 成 为 可 能 。 逻 辑 复制 功能 的 另 一 个 好 处 是 

可 以 让 从 节点 有 上 自己 专属 的 表 ， 这 些 表 不 参与 复制 ， 可 以 在 从 

节点 上 对 其 进行 任意 修改 。 该 版 本 还 引入 了 “临时 复制 槽 2 的 概 

念 ， 通 过 它 可 以 实现 创建 一 次 性 的 复制 模 ， 一 旦 创建 者 会 话 退 

出 ， 则 该 复制 模 会 自动 消失 。 当 通过 pg_basebackup 对 整个 

服务 器 进行 基础 备份 时 ， 该 功能 特别 有 用 。 


尽管 逻辑 复制 是 PostgreSQL 10 才 原 生 支持 的 新 特性 ， 但 其 实 从 
PostgreSQL 9.4 开始 用 户 已 经 可 以 通过 开源 的 pglogical 扩展 包 来 
实现 逻辑 复制 能 力 。 如 果 你 需要 在 不 同 的 PostgreSQL 大 版 本 间 进 
行 复制 ， 比 如 PostgreSQL 10 和 PostgreSQL 9.4~9.6 之 间 ， 可 以 通 
过 在 两 端的 PostgreSQL 服务 器 上 都 安装 相应 版 本 的 pglogical 扩 
展 包 来 实现 。 如 需 在 PostgreSQL 10 和 将 来 的 新 版 本 间 进 行 逻 辑 复 
是 则 无 须 借助 pglogical ， 直 接 使 用 原生 的 逻辑 复制 能 力 即 

DJ 。 





























10.1.3 第 三 方 复 制 解决 方案 


除了 PostgreSQL 目 带 的 复制 机 制 外 ， 还 有 很 多 第 三 方 提供 的 复制 
工具 ，Slony 和 Bucardo 是 其 中 应 用 最 广泛 的 两 个 ， 而 且 都 是 开源 
的 。 尽 管 PostgreSQL 原生 复制 机 制 在 每 个 版 本 中 都 会 得 到 功能 强 
化 ， 但 Slony、Bucardo 以 及 其 他 第 三 方 工具 仍然 在 灵活 性 方面 有 
着 原生 复制 机 制 难以 比拟 的 优势 ， 它们 文 持 仅 复 制 单个 database 或 
者 单 张 表 ; 它们 也 不 要 求 复 制 的 源 端 和 目的 端的 PostgreSQL 版 本 
和 操作 系统 相同 ;它们 还 文 持 多 主 复制 。 但 它们 也 有 缺点 : 两 个 工 
上 共 均 依赖 于 新 建 额 外 的 触发 器 来 触发 复制 动作 ， 同 时 还 可 能 需要 在 














被 复制 表 上 增加 一 些 额外 的 字段 ， 因 此 它们 对 系统 架构 有 一 定 的 侵 
入 性 ;并且 它 们 一 般 不 支持 建 表 、 安 装 扩 展 包 等 DDL 操作 的 同 
步 。 可 以 看 出 ， 这 些 第 三 方 解 决 方案 相 比 原 生 复 制 方案 需要 更 多 的 
信 工 下 预 ， 比 如 建 触发 占 ， 为 表 加 字段 或 者 创建 额外 的 钢 图 ， 鹤 





我 们 强烈 建议 你 在 决定 使 用 哪 一 种 产品 之 前 参考 一 下 “Replication， 
Clustering, and Connection Pooling” 这 篇 文章 。 


01. 10.2 ”复制 环境 的 搭建 
本 节 将 介绍 搭建 用 于 针对 整个 PostgreSQL 服务 器 的 复制 环境 的 所 
有 步骤 。 我 们 将 使 用 流 式 复 制 模式 来 实现 ， 该 模式 基于 主 服 务 器 和 
从 属 服务 器 之 间 的 数据 库 连 接 来 进行 WAL 日 志 传 输 。 
10.2.1 主 服务 器 的 配置 
主 服 务 器 的 基本 配置 步骤 如 下 所 示 。 


() 创建 一 个 专用 于 复制 的 用 户 账 号 。 


CREATE ROLE pgrepuser REPLICATION LOGIN PASSWORD ‘woohoo'; 


(2) 在 postgresql.conf 中 设置 好 以 下 配置 项 。 也 有 一 种 无 须 直 接 修改 
配置 文件 的 方法 : 使 用 ALTER SYSTEM set 参数 名 = 参数 值 来 

修改 配置 项 值 ， 改 好 以 后 执行 SELECT pg_reload_conf() 来 让 配 
置 生效 。 








listen addresses = * 
wal level = hot_standby 
archive mode = on 


max wal senders = 5 
wal keep_ segments = 16 











如 果 你 希望 基于 逻辑 复制 来 实现 部 分 表 的 复制 ， 那 么 要 将 
wal_level 设置 为 1ogical 。logical 模式 相 比 hot_standby 模 
式 会 记录 更 多 事务 日 志 ， 因 此 logical 模式 既 适 用 于 整个 
PostgreSQL 服务 器 复制 场景 ， 叉 适用 于 指定 部 分 表 复 制 的 场景 。 


以 上 设置 在 PostgreSQL 官方 手册 的 “服务 器 配置 ， 复制 ?一 节 中 有 
详细 介绍 。 如 果 主 从 服务 器 的 距离 很 远 ， 而 且 主 服务 器 上 的 事务 处 
理 又 很 繁忙 ， 那 么 我 们 建议 把 wal_keep_segments 参数 设 得 大 一 
点 。 如 果 运 行 的 是 PostgreSQL 9.6 或 更 高 版 本 ， 应 该 将 wal_level 

















设置 为 replica ， 而 不 是 上 面 写 的 hot_standby 。 为 了 后 同 兼 
容 ，PostgreSQL 9.6 中 会 将 hot_standby 目 动 当成 replica 处 
理 。 


(3) 在 postgresql.conf 中 添加 archive_command 配置 指令 ， 或 者 用 

ALTER SYSTEM 修改， 该 参数 的 含义 是 WAL 日 志 的 保存 路 径 。 在 

流 式 复 制 模式 下 ， 访 配置 指令 中 的 目标 路 径 可 设 定 为 任何 路 径 。 更 
多 有 关 此 配置 指令 的 信息 ， 请 参 9 PostgreSQL 官方 手册 中 

的 “PostgreSQL PGStandby 工具 介绍 ”一 节 。 








在 Linux/Unix 上 ，archive_command 行 可 参照 如 下 格式 设 定 : 


archive command = 'cp %p ../archive/%f' 





也 可 以 使 用 rsync 命令 蔡 代 cp 以 实现 异地 归档 : 


archive command = 'rsync -av %p postgresQ192.168.6.16:archive/Xf 





在 Windows 上 可 按 如 下 形式 设 定 : 


archive command = 'copy %p ..\\archive\\%f' 





(4) 在 pg_hba.conf 文件 中 设置 一 条 权限 规则 ， 以 允许 从 属 服务 需 作 





为 复制 体系 中 的 客户 端 连 到 主 服务 器 。 例 如 ， 以 下 这 条 规则 所 代表 
的 含义 是 : 允许 你 人 pgrepuser 
的 PostgreSQL 账号 连接 到 主 服 务 占 ， 其 IP 地 址 了 犯 围 为 192.168.0.1 
到 192.168.0.254， 验 证 方式 为 基于 MD5 的 加 密 密 码 。 


host replication pgrepuser 192.168.6.6/24 md5 


(5) 重启 PostgreSQL 服务 来 让 所 有 配置 生效 。 


使 用 PostgreSQL 安装 路 径 下 的 bin 文件 夹 中 的 pg _basebackup 工 
具 ， 来 为 整个 PostgreSQL 服务 器 创建 一 个 全 量 备 份 。 备 份 结果 包 
含 指定 目录 下 的 全 量 数据 文件 的 副本 。 


使 用 pg_basebackup 工具 时 ， 如 果 加 上 了 --xlog-method- 
stream 参数 ， 则 会 把 所 有 WAL 日 志 也 备份 下 来 ， 过 程 中 会 建立 
一 个 数据 库 连 接 用 于 进行 WAL 复制 ， 如 果 加 上 了 -R 参数 ， 则 会 
自动 创建 一 个 用 于 恢复 的 配置 文件 。 


\ 在 PostgreSQL 10 中 ， 原 先 的 pg_xlog 目录 已 经 被 重合 
为 pg_wal。 


在 下 面 的 例子 中 ， 我 们 登录 到 从 属 服务 器 并 针对 主 服务 器 
(192.168.0.1) 做 了 一 次 流 式 全 量 备份 : 


pg_basebackup -D /target dir -h 192.168.60.1 \ 
--port=5432 --checkpoint=fast 


--Xlog-method=stream -R 





如 果 你 是 为 了 实现 备份 的 目的 而 使 用 pg_basebackup ， 那 么 可 以 
使 用 先 打 TAR 包 再 做 压缩 这 种 和 常见 输出 形式 ， 最 终 会 在 备份 目标 
目录 下 为 每 个 表 空 间 生成 一 个 tar.gz 文件 。 注 意 ， 下 面 的 命令 行 中 
的 -X 等 同 于 --xlog-method 。 由 于 流 式 日 志 不 支持 以 压缩 格式 
备份 ， 所 以 需要 把 取 日 志 的 方式 改 为 文件 传递 ， 命 令 行 如 下 : 


pg_basebackup -Z9 -D /target dir/ -h 192.168.6.1 -Ft -Xfetch 


除了 备份 全 量 数据 外 ， 我 们 一 般 还 会 将 WAL 日 志 也 纳入 备份 体系 
中 。 为 了 实现 这 一 点 ， 在 PostgreSQL 10 之 前 ， 需 要 使 用 
pg_receivexlog 工具 来 获取 事务 日 志 ， 在 PostgreSQL 10 以 及 之 
后 的 版 本 中 ， 该 工具 被 改名 为 pg_receivewal 。 只 需 为 该 工具 设 
置 一 个 定时 任务 ， 即 可 实现 持续 地 导出 并 备份 事务 日 志 。 


10.2.2 ”为 从 属 服务 器 配置 全 量 复 制 环 境 





























如 果 搭 建 的 是 逻辑 复制 环境 ， 请 忽略 本 节 内 容 。 建 议 从 属 服务 器 与 
主 服务 器 的 各 项 系统 配置 完全 相同 ， 这 会 为 你 减少 很 多 麻烦 ， 特 别 
是 当 你 需要 搭建 一 套用 于 保障 系统 高 可 用 的 主 备 倒 换 环境 时 ， 这 一 
点 尤其 重要 。 此 外 ， 如 果 要 在 主 服 务 器 上 安装 扩展 包 ， 那 么 从 节点 
上 必须 有 相应 扩展 包 的 二 进 制 安装 文件 ， 否 则 在 主 节 点 上 执行 

CREATE EXTENSION 后 ， 从 节点 上 执行 恢复 过 程 时 就 会 报错 。 从 属 
WAL 事务 日 志 。 有 具体 配 

步骤 如 下 。 


(1) 新 建 一 个 数据 库 实 例 作为 从 属 服务 左 ， 要 求 采 用 与 主 服 务 左 相 
同 的 PostgreSQL 版 本 《最 好 是 小 版 本 号 也 完全 相同 ) 。 事 实 上 ， 
PostgreSQL 官方 并 不 要 求 主 服务 器 和 从 属 服务 器 的 PostgreSQL 软 
件 的 小 版 本 号 也 完全 相同 。 其 实 你 可 以 尝试 一 下 ， 看 看 在 不 一 样 的 
情况 下 是 否 能 够 配置 成 功 。 


(2) 关闭 从 属 服务 器 的 PostgreSQL 服务 。 
使 用 pg_basebackup 导出 的 文件 履 辣 从属 服务 器 上 的 相应 文 














(4) 将 下 面 的 配置 设置 添加 到 postgresql.auto.conf 文件 中 。 


hot_standby = on 
max_connections = 26 #set to higher or equal to master 


(5) 从 属 服务 器 的 侦 听 端口 不 必 与 主 服 务 器 一 样 ， 因 此 可 以 选择 在 
postgresql.auto.conf 或 者 postgresql.conf 中 更 改 端口 ， 也 可 以 通过 其 
他 特定 于 操作 系统 的 启动 脚本 进行 更 改 ， 这 些 局 动 脚本 会 在 局 动 之 
前 设置 PGPORT 环境 变量 。 


(6) 在 data 文件 夹 下 创建 一 个 名 为 recovery.conf 的 新 文件 ， 内 容 如 
下 (注意 下 面 第 二 行 中 要 修改 为 真实 的 主机 名 、IP 地 址 和 端口 ) 。 
如 有 果 前 面 使 用 了 pg_basebackup 进行 全 量 导 出 ， 那 么 该 文件 已 自 
动 生成 ， 只 需 手 动 加 上 trigger_file 那 一 行 即 可 。 





standby _ mode = "on 
primary_conninfo = 'host=192.168.6.1 port=5432 user=pgrepuser 


password=woohoo application name=replical' 
trigger file = 'failover.now’ 





(7) 如 宁 发 现 从 属 服务 器 处 理事 务 日 志 的 速度 较 慢 ， 跟 不 上 主 服 务 





器 产生 日 志 的 速度 ， 为 避免 主 服务 器 产生 积压 ， 你 可 以 在 从 属 服务 
器 上 指定 一 个 路 径 用 于 缓存 暂 未 处 理 的 日 志 。 请 在 recovery.conf 中 
添加 如 下 一 个 代码 行 ， 该 代码 行 在 不 同 操作 系统 下 会 有 所 不 同 。 
Linux/Unix 下 : 


restore command = "cp %p ../archive/%f' 


Windows 下 : 


restore command = 'copy %p ..\\archive\\%f' 


J 中 ， 路 径 中 指定 的 archive 文件 夹 就 是 我 们 用 于 缓存 日 志 的 
交 件 类 


10.2.3 ”局 动 流 复制 进程 


如 果 你 已 经 用 pg_basebackup 完成 了 数据 全 量 导 出 ， 那 么 请 查看 
一 下 其 中 的 recovery.conf 文件 的 内 容 ， 确 认 是 否 均 正常 ， 然 后 再 启 
动 从 属 服务 器 。 


此 时 所 有 主 从 属 服务 器 应 该 都 是 能 访问 的 。 主 服务 器 的 任何 修改 ， 
包括 安装 一 个 扩展 包 或 者 是 新 建 表 这 种 对 系统 元 数据 的 修改 ， 痢 会 
被 同步 到 从 属 服务 器 。 从 属 服务 器 可 对 外 提供 查询 服务 。 


如 果 和 希望 某 个 从 属 服务 堪 脱 离 当 前 的 主 从 复制 环境 ， 即 此 后 以 一 台 
独立 的 PostgreSQL 服务 器 映 份 而 存在 ， 请 直接 在 其 data 文件 夹 下 
创建 一 个 名 为 failover.now 的 空 文件 。 从 属 服务 器 会 在 处 理 完 当前 
接收 到 的 最 后 一 条 事务 日 志 后 停止 接收 新 的 日 志 ， 然 后 将 recovery. 
conf 改名 为 recovery.done。 此 时 从 属 服务 器 已 与 主 服务 器 彻底 解 











除了 复制 关系 ， 此 后 这 人 台 PostgreSQL 服务 器 会 作为 一 台独 立 的 数 
据 库 服务 器 存在 ， 其 数据 的 初始 状态 残 是 它 作 为 从 属 服 务 器 时 处 理 
完 最 后 一 条 事务 日 志 后 的 状态 。 一 旦 从 属 服务 如 脱离 了 主 从 复制 环 
境 ， 就 不 可 能 再 切换 回 主 从 复制 状态 了 。 要 想 切 换 回去 ， 必 须 按照 
前 述 步骤 一 切 从 零 开始 。 


10.2.4 ”使 用 逻辑 复制 实现 部 分 表 或 者 部 分 database 的 复 
制 ] 


PostgreSQL 10 支持 通过 逻辑 复制 能 力 实现 仪 复制 部 分 表 或 者 整 
PostgreSQL 服务 器 上 的 若干 database。 逻 辑 复制 的 一 大 优势 是 
在 PostgreSQL 10 和 未 来 更 新 的 版 本 间 进 行 复制 ， 而 且 不 需要 主 从 
节点 的 操作 系统 和 硬件 架构 相同 。 例 如 ， 我 们 可 以 实现 一 台 Linux 
的 PostgreSQL 服务 器 与 一 台 Windows 的 PostgreSQL 服务 器 之 间 的 
复制 。 








在 逻辑 复制 的 概念 体系 中 ， 数 据 提供 方 的 服务 器 被 称 为 “发 布 

者 ”(publisher) ， 数 据 接收 方 的 服务 器 被 称 为 “订阅 

者 ”(Subscriber) 。 在 发 布 者 服务 器 上 需 复 制 的 表 所 在 的 database 
中 执行 CREATE PUBLICATION ， 即 可 将 待 复 制 的 表 作 为 数据 源 发 
布 出 去 ;在 订阅 者 服务 器 上 要 接收 数据 的 database 中 执行 CREATE 
SUBSCRIPTION ， 来 指定 要 从 哪个 发 布 者 服务 器 的 哪个 数据 源 来 订 
阅 数据 。 逻 辑 复制 的 主要 问题 在 于 它 不 支持 DDL 复制 ， 因 此 要 求 
待 复制 的 表 在 开始 复制 之 前 在 主 从 服务 器 都 必须 先 建 好 。 

假设 我 们 的 一 台 服 务 器 上 运行 着 两 个 PostgreSQL 10 服务 实例 ， 发 
布 端 PostgreSQL 的 侦 昕 端口 是 5447， 订 阅 端 PostgreSQL 的 侦 听 端 
口 是 5448。 不 管 这 两 个 PostgreSQL 实例 是 运行 在 同一 台 服 务 器 还 
是 不 同 服务 器 上 ， 以 下 过 程 都 是 一 样 的 。 在 二 者 之 间 搭 建 逻 辑 复制 
的 过 程 如 下 。 


(1) 在 发 布 端 PostgreSQL 实例 上 确保 以 下 参数 已 配置 : 


SHOW wal level 


如 果 显 示 的 值 不 是 logical ， 那 么 请 使 用 以 下 命令 修改 : 


ALTER SYSTEM SET wal level = logical; 


然后 重启 PostgreSQL 服务 。 


如 采 需 要 实现 级 联 复制 ， 即 订阅 端 服 务 器 也 需要 作为 发 布 者 来 问 下 
一 级 订阅 者 进行 发 布 ， 那 么 在 订阅 端 服务 器 上 最 好 也 把 wal_level 
配置 成 logical 。 


(2) 在 订阅 端 服务 器 上 的 目标 database 中 创建 待 复制 的 表 。 如 果 你 
有 许多 表 要 复制 或 者 要 复制 发 布 端 某 个 database 的 所 有 表 ， 那 么 建 
议 你 使 用 pg_dump 将 待 复制 的 表 结 构 导 出 来 ， 然 后 拿 到 订阅 端 服 
务 器 上 执行 。 例 如 ， 如 果 需 要 复制 postgresql_book 这 个 database， 
通过 以 下 语句 可 以 导出 其 结构 : 











pg_dump -U postgres -p5447 -Fp --section pre-data --section post-data 
-f pub_struct.sql postgresql_ book 





然后 用 psql 连接 到 订阅 端 服务 器 上 执行 前 面 导 出 的 脚本 ， 命 令 如 
下 : 


CREATE DATABASE book_sub ; 
\connect book_sub ; 


\i pub_ struct.sql 





(3) 然后 在 发 布 端 服务 器 上 针对 竺 复制 的 database 创建 一 个 数据 
源 。 我 们 在 这 个 例子 中 将 使 用 CREATE PUBLICATION 来 实现 对 某 
个 database 中 所 有 表 的 复制 。 请 注意 ， 以 下 命令 针对 将 来 在 此 
database 中 建立 的 表 也 生效 ， 但 要 想 这 些 后 建 的 表 能 复制 成 功 ， 需 
要 先 到 订阅 端 服务 器 上 把 这 些 新 表 也 创建 一 下 : 


CREATE PUBLICATION full db_pub 
FOR ALL TABLES; 





(4) 要 想 刚 刚 建立 的 发 布 数 据 源 起 作用 ， 需 要 对 其 进行 订阅 消费 。 
连接 到 订阅 端 服务 器 上 的 book _sub 这 个 database 中 ， 然 后 执行 以 


下 命令 ; 


\connect book_sub ; 
CREATE SUBSCRIPTION book_sub 
CONNECTION ‘host=localhost port=5447 dbname=postgresql book \ 


user=postgres'" 
PUBLICATION full db_pub; 





以 上 命令 执行 完毕 后 ， 碍 看 一 下 订阅 端 book_sub 库 中 的 表 ， 可 以 
看 到 其 中 已 经 有 了 首次 同步 复制 过 来 的 数据 。 如 果 在 发 布 端的 
postgresql_book 库 中 插入 新 的 记录 ， 可 以 看 到 book_sub 中 已 经 复 
制 过 来 了 。 


如 果 不 再 需要 某 个 发 布 端 或 者 订阅 端 ， 可 以 使 用 DROP 
SUBSCRIPTION 和 DROP PUBLICATION 删除 它们 。 





01. 10.3 ”外 部 数据 封装 器 


外 部 数据 封装 器 (FDW) 是 PostgreSQL 提供 的 一 种 用 于 访问 外 部 
数据 源 的 手段 ， 它 是 可 扩展 的 ， 也 兼容 业界 标准 。 该 机 制 所 支持 的 
外 部 数据 源 包括 PostgreSQL 以 及 其 他 非 PostgreSQL 数据 源 。FDW 
的 核心 概念 是 “外 部 表 ”， 这 种 表 看 起 来 和 当前 PostgreSQL 中 其 他 
表 的 用 法 完全 相同 ， 但 事实 上 其 数据 本 体 是 存在 于 外 部 数据 源 中 
的 ， 该 数据 源 甚 至 可 能 存在 于 另外 一 台 物 理 服务 嚣 上。 一旦 定义 好 
了 外 部 表 ， 其 定义 就 会 在 当前 数据 库 中 持久 化 ， 你 就 可 以 放心 地 与 
使 用 普通 表 一 样 使 用 它 ，FDW 完全 屏蔽 了 与 外 部 数据 源 之 间 的 复 
杂 通 信 过 程 。 比 较 流行 的 FDW 及 其 用 法 示例 可 以 通过 PostgreSQL 
FDW 维基 百科 页 面 查 到 。 可 以 通过 PGXN FDW 页 面 和 PGXN 
Foreign Data Wrapper 页 面 查 到 PostgreSQL 的 FDW 目录 。 在 
GitHub 上 搜索 “PostgreSQL Foreign Data Wrappers”， 可 以 搜索 到 前 
述 很 多 FDW 的 源码 ， 另 外 还 能 找到 一 些 不 在 前 述 列表 中 的 FDW。 
如 果 你 需要 自行 封装 某 个 外 部 数据 源 ， 那 么 请 先 到 前 面 提 供 的 这 些 
站 点 中 查询 一 下 别人 是 否 已 实现 ， 如 果 没 有 ， 再 自己 做 。 如 果 封 装 
成 功 ， 请 记得 发 布 出 来 与 社区 分 享 。 


大 多 数 PostgreSQL 安装 包 会 默认 携 融 两 个 FDW: file_fdw 和 
postgres_fdw ， 但 默认 没有 安装 ， 你 可 以 执行 CREATE 
EXTENSION 来 安装 它们 。 


直到 PostgreSQL 9.2 为 止 ，FDW 仅 支 持 对 外 部 表 进 行 查询 。 
PostgreSQL 9.3 中 引入 了 一 组 新 的 API， 实 现 了 对 外 部 表 的 修改 。 
但 PostgreSQL 自 带 的 FDW 中 只 有 postgres_fdw 支持 此 特性 。 


本 节 中 ， 我 们 将 同 你 演示 如 何 注册 外 部 服务 器 、 外 部 用 户 以 及 外 部 
表 ， 最 后 介绍 如 何 查 询 外 部 表 。 我 们 使 用 的 例子 中 都 使 用 SQL 命 
令 行 来 创建 和 删除 对 象 ， 你 也 可 以 通过 pgAdmin 的 图 形 化 界面 工 
具 来 实现 相同 的 操作 。 


10.3.1 查询 平面 文件 


可 以 使 用 file_fdw 这 个 FDW 来 查询 平面 文件 ， 它 是 以 扩展 包 的 
形式 存在 的 ， 因 此 可 以 通过 以 下 SQL 安装 : 






































CREATE EXTENSION file fdw; 


尽管 通过 file_fdw 可 以 直接 读 取 数据 库 实例 所 在 的 本 地 服务 右上 
的 文件 ， 但 为 了 和 别 的 FDW 在 语义 上 保持 一 致 ， 还 是 得 定义 一 个 
交 辑 上 的 外 部 服务 器 。 请 执行 以 下 命令 来 定义 一 个 “ 伪 ” 外 部 服务 


CREATE SERVER my_server FOREIGN DATA WRAPPER file fdw; 


接 下 来 要 注册 外 部 表 。 你 可 以 将 外 部 表 置 于 任何 一 个 schema 中 ， 
但 我 们 一 般 是 创建 一 个 单独 的 schema 来 容纳 所 有 的 外 部 表 。 接 下 
来 将 使 用 一 个 名 为 staging 的 schema， 如 示例 10-1 所 示 。 


这 里 先 列 出 儿 行 我 们 将 要 访问 的 外 部 文件 的 内 容 ， 每 一 行内 的 季 段 
用 管道 符 分 隔 ， 格 式 如 下 : 














Dev|Company 
Tom Lane|Crunchy Data 


Bruce Momjian|EnterpriseDB 











示例 10-1 定义 基于 分 隅 符 格 式 文件 的 外 部 表 


CREATE FOREIGN TABLE staging.devs (developer VARCHAR(156), company VAR 
SERVER my_server 
OPTIONS ( 

format 'csv', 

header 'true', 

filename '/postgresql book/ch1i6/devs.psv', 


delimiter'|', 
null"' 





上 面 的 示例 中 ， 尽 管 外 部 表 映 射 到 一 个 用 管道 得 作为 分 阳 符 的 平面 


文件 ， 但 我 们 依然 将 其 标识 为 “csv” 格 式 。 有 人 可 能 会 根据 

CSV (comma seperated values) 的 名 称 认为 只 有 用 逗号 作为 分 隔 符 
的 文件 才能 称 为 CSV， 但 在 FDW 的 术语 体系 中 ，CSV 文件 就 是 以 
某 种 分 隔 符 来 区 分 列 值 的 平面 文件 ， 不 管 这 个 分 隔 符 具 体 是 什么 字 
符 ， 都 可 以 称 之 为 CSV。 


上 述 定义 步骤 完成 后 ， 你 就 可 以 直接 通过 SQL 访问 外 部 表 了 : 


SELECT * FROM staging.devs WHERE developer LIKE ‘'T%'; 


如 果 不 再 需要 此 外 部 表 ， 可 以 删 挥 : 


DROP FOREIGN TABLE staging.devs; 


10.3.2 ”以 不 规则 数组 的 形式 查询 不 规范 的 平面 文件 


通常 ， 平 面 文件 在 每 一 行 中 会 有 许多 不 同 的 列 ， 并 且 包 含 多 个 标题 
行 和 页 脚 行 。 我 们 最 喜欢 使 用 file_textarray_fdw 这 个 FDW 来 
处 理 这 种 非 结 构 化 平面 文件 。 该 FDW 能 处 理 任何 带 分 隔 符 的 平面 
文件 ， 即 使 每 一 行 中 的 元 素数 量 不 一 致 也 没 问题 ， 因 为 它 可 以 将 每 
一 行 作为 一 个 变 长 的 文本 数组 (text[] ) 来 进行 处 理 。 


问题 是 file_textarray_fdw 不 是 PostgreSQL 原生 支持 的 扩展 
包 ， 因 此 你 必须 手动 编译 安装 它 。 首 先 ， 在 安装 PostgreSQL 时 需 
要 附带 安装 系统 头 文件 ， 以 便于 后 续 的 编译 。 然 后 从 Adunstan 
GitHub 这 个 站 点 下 载 file_textarray_fdw 的 源码 。 请 注意 : 该 
站 点 为 每 个 PostgreSQL 版 本 都 准备 了 相应 的 源码 ， 请 确保 选择 的 
是 正确 的 版 本 。 在 编译 完成 后 ， 请 将 它 以 扩展 包 的 形式 安装 好 ， 该 
过 程 与 前 面 介绍 过 的 安装 其 他 FDW 的 过 程 完全 相同 。 


如 果 你 的 环境 是 Linux/Unix， 只 要 安装 了 postgresq1l-dev 这 个 
包 ， 那 么 编译 过 程 是 很 简单 的 ， 但 在 Windows 上 就 比较 厅 烦 ， 所 
以 我 们 已 经 为 你 编译 好 了 安装 包 ， 你 可 以 从 以 下 几 个 链接 中 选择 合 
适 的 版 本 下 载 。Windows 32/64 位 适 配 PostgreSQL 




















9.4: http:/www.postgresonline.com/journal/archives/340-Foreign- 
Data-Wrappers-for-PostgreSQL-9.4- 
Windows.htmlhttp:/bit.ly/2o0RDY6X 。Windows 32/64 位 适 配 
PostgreSQL 9.5 和 PostgreSQL 

9.6: http:/www.postgresonline.com/journal/archives/361-Foreign- 
Data-Wrappers-for-PostgreSQL-9.5-windows.html 。 


FDW 安装 好 以 后 ， 首 先 创建 扩展 包 。 


CREATE EXTENSION file textarray_fdw; 


然后 就 跟 安装 其 他 FDW 时 一 样 ， 创 建 好 外 部 服务 器 。 


CREATE SERVER file taserver FOREIGN DATA WRAPPER file textarray_fdw; 


然后 设置 外 部 表 。 可 以 将 外 部 表 放 入 任何 一 个 你 认为 合适 的 
schema 中 。 在 示例 10-2 中 ， 我 们 将 再 次 使 用 前 面 用 过 的 staging 


Schema。 


示例 10-2 ”创建 一 个 基于 文本 数组 的 外 部 表 


CREATE FOREIGN TABLE staging.factfinder array (x text[]) 

SERVER file taserver 

OPTIONS ( 
format 'csv', 
filename '/postgresql book/ch16/DEC 18 SF1 QTH1 with ann.csv', 
header 'false', 


delimiter "，， 
quote '"',， 
encoding 'latin1', 
null "" 





假设 我 们 要 处 理 这 样 一 个 CSV 文件 : 文件 中 含有 8 个 标题 行 ， 而 
列 数 多 得 我 们 不 想 数 。 当 前 述 设置 步骤 都 完成 后 ， 就 可 以 直接 碍 询 








这 个 文件 的 内 容 了 。 通 过 以 下 查询 可 以 得 到 标题 行 的 名 称 ， 这 些 标 
题 行 的 第 一 个 列 标 头 为 GE0.id 。 


SELECT unnest(x) FROM staging.factfinder array WHERE x[1] = 'GEO.id' 


以 下 查询 能 查 出 数据 的 前 两 列 。 


SELECT x[1] As geo id, x[2] As tract id 
FROM staging.factfinder array WHERE x[1] ~ '[8-9]+'; 





10.3.3 ”查询 其 他 PostgreSQL 服 务实 例 上 的 数据 

从 9.3 版 开始 ， 大 多 数 的 PostgreSQL 发 行 包 都 包含 了 
postgres_fdw 这 个 FDW。 通 过 它 还 可 以 对 其 他 PostgreSQL 服务 
0 读 取 和 修改 操作 ， 哪 怕 两 边 的 PostgreSQL 版 本 不 
一 臻 也 没关系 。 


首先 也 是 要 进行 EDW 扩展 包 的 安装 。 


CREATE EXTENSION postgres fdw; 


然后 创建 外 部 服务 器 。 


CREATE SERVER book server 
FOREIGN DATA WRAPPER postgres fdw 


OPTIONS (host 'localhost', port '5432', dbname 'postgresql book'); 





如 果 创 建 好 外 部 服务 器 后 需要 更 改 连 接 选 项 或 将 其 添加 到 外 部 服务 
器 ， 则 可 以 使 用 ALTER SERVER 命令 。 比 如 ， 如 果 需 要 更 改 你 所 指 
回 的 服务 器 ， 可 以 执行 以 下 代码 行 。 


ALTER SERVER book server OPTIONS (SET host “prod ' ) ; 





从、 对 于 主机 、 端 口 和 database 这 几 项 的 连接 设置 的 更 改 只 
对 新 建立 的 会 话 生效 ， 不 会 影响 已 有 的 会 话 。 原因 是 会 话 在 开 
始 时 建立 ， 此 后 束 一 直 复 用 ， 而 不 会 断 开 重 连 


然后 创建 一 个 用 户 映 射 关系 1， 将 远 端 的 某 个 角色 映射 到 本 地 的 
public 角色 



































1 所谓“ 用户 映射 "是 指 在 远 端 服务 器 的 某 个 角色 和 本 地 服务 器 的 某 个 角色 之 间 建 立 对 应 
关系 ， 这 样本 地 角色 可 以 用 远 端 角色 的 权限 来 操作 远 端 服务 器 上 的 数据 。 一 一 译 者 注 











CREATE USER MAPPING FOR public SERVER book_ server 
OPTIONS (user 'role on foreign', password 'your_password ' ) ; 




















注意 ， 上 述 映射 关系 中 的 远 端 角色 必须 是 一 个 已 存在 的 角色 ， 并 且 有 





注意 ， 上 述 映射 关系 中 的 远 端 角色 必须 是 一 个 已 存在 的 角色 ， 
ES 这 样 任何 能 连 到 本 地 数据 库 的 用 户 痢 可 以 连 到 远 端 数 
据 库 。 


现在 可 以 创建 外 部 表 了 。 该 表 可 以 映射 远 端 表 的 全 部 或 部 分 列 。 在 
示例 10-3 中 ， 我 们 创建 了 一 个 外 部 表 ， 映 射 到 远 端 数据 库 上 的 


censu.facts 表 。 


示例 10-3 ”定义 一 个 映 冉 到 远 端 PostgreSQL 数据 库 的 外 部 表 





CREATE FOREIGN TABLE ft facts ( 
fact type_id int NOT NULL, 
tract_ id varchar(11), 
yr int, val numeric(12,3), 


perc numeric(6,2) 


) 


SERVER book server OPTIONS (schema name 'census', table name 'facts'); 











上 面 的 示例 仅 包含 外 部 表 的 最 基本 的 选项 。 默 认 情 况 下 ， 了 映射 到 远 


端 PostgreSQL 数据 库 的 外 部 表 都 是 可 更 新 的 ， 当 然 前 提 是 映射 天 

系 中 所 使 用 的 远 端 数据 库 角 色 对 映射 的 远 端 表 要 有 修改 权限 。 该 

updatable 设置 是 一 个 布尔 设置 ， 可 以 在 定义 外 部 表 或 者 外 部 服务 

0 例如 ， 如 果 想 把 外 部 表 设 定 为 只 读 ， 可 以 执行 以 下 
人 码 行 。 


ALTER FOREIGN TABLE ft _ facts OPTIONS (ADD updatable 'false'); 


要 将 表 设 置 回 updatable 状态 ， 请 执行 以 下 代码 行 。 


ALTER FOREIGN TABLE ft facts OPTIONS (SET updatable “true ' ) ; 


表 级 别 上 的 updatable 属性 会 蔡 代 外 部 服务 器 设置 。 


ALTER FOREIGN TABLE 语句 除了 可 以 更 改 OPTIONS 之 外 ， 还 可 以 
添加 或 者 删除 列 ， 语 法 是 ALTER FOREIGN TABLE .. DROP 
COLUMN 。 








PostgreSQL 9.5 中 引入 了 对 IMPORT FOREIGN SCHEMA 命令 的 支 
持 ， 它 可 以 实现 外 部 表 的 自动 创建 ， 从 而 为 用 户 节 省 大 量 时 间 。 不 
过 请 注意 ， 并 不 是 所 有 的 FDW 都 支持 IMPORT FOREIGN SCHEMA 
能 力 。 每 个 FDW 在 执行 外 部 表 结 构 导 入 时 都 可 以 设置 一 些 服 务 端 
参数 。 对 于 postgres_fdw 来 说 ， 支 持 的 参数 如 下 。 





import_collate 


是 否 将 远 端 PostgreSQL 服务 器 上 的 字符 排序 规则 设置 也 导入 
到 本 地 外 部 表 。 默 认为 true 。 


import_ default 


是 否 将 远 端 PostgreSQL 服务 器 上 的 字段 默认 值 属性 也 导入 到 
本 地 外 部 表 中 。 默 认为 false ， 即 本 地 服务 器 上 的 外 表 字 段 上 没 
有 默认 值 。 当 要 对 外 表 进 行 数据 插入 操作 时 ， 默 认 值 是 有 用 的 : 如 
果 Insert 语句 中 未 包括 某 字 段 ， 则 插入 结果 中 会 取 该 字段 的 默认 




















值 ， 因 此 理论 上 应 该 要 把 默认 值 信息 复制 过 来 。 但 有 一 点 请 特别 注 
意 : 如 末 该 字段 的 默认 值 是 基于 一 个 厅 列 号 生成 费 的 自动 递增 值 ， 
则 其 效果 未 必 符 合 你 的 预期 ， 因 为 本 地 服务 器 上 得 到 的 序列 号 和 远 
端 服务 器 上 得 到 的 序列 号 完全 可 能 不 一 样 。 








ijmport not _ null 


是 否 将 远 端 PostgreSQL 服务 器 上 的 字段 NOT NULL 属性 导入 
到 本 地 外 部 表 中 。 默 认为 true 。 


在 示例 10-4 中 ， 我 们 将 远 端 PostgreSQL 服务 器 上 books.public 这 
个 schema 中 的 所 有 表 结 构 导 入 本 地 服务 器 并 自动 生成 了 外 部 表 。 


示例 10-4 使 用 IMPORT FOREIGN SCHEMA 命令 来 导入 一 个 
schema 中 的 所 有 表 结 构 


CREATE SCHEMA remote census; 
IMPORT FOREIGN SCHEMA public 
FROM SERVER book server 


INTO remote census 
OPTIONS (import default 'true'); 





如 上 例 10-4 所 示 ，IMPORT FOREIGN SCHEMA 命令 会 为 外 部 
schema 中 的 每 张 表 在 本 地 的 remote_census schema 中 创建 一 张 
同名 的 外 部 表 。 


如 果 只 想 导入 部 分 表 ， 可 以 使 用 LIMIT TO 或 者 EXCEPT 子 句 。 例 
如 ， 如 果 只 希望 导入 facts 和 lu _ fact _type 这 两 张 表 ， 可 以 这 
么 写 : 





IMPORT FOREIGN SCHEMA census 
LIMIT TO (facts, lu fact types) 


FROM SERVER book server INTO remote census; 





如 果 LIMIT TO 后 面 指定 的 表 在 远 端 PostgreSQL 服务 器 上 不 存 
在 ， 系 统 会 直接 忽略 掉 ， 不 会 报错 。 我 们 建议 在 执行 完 导 入 外 部 表 


ee 以 确保 所 有 你 希望 导入 的 表 的 确 均 已 导入 成 
功 。 


EXCEPT 与 LIMIT TO 用 法 类 似 ， 只 不 过 二 者 效果 正好 相 
反 : EXCEPT 用 于 指定 哪些 表 不 要 导入 ; LIMIT TO 用 于 指定 哪些 表 
A 


如 果 你 在 PostgreSQL 系统 中 使 用 了 一 些 扩 展 包 提供 的 能 力 ， 那 么 
可 能 需要 用 到 外 部 服务 器 的 一 个 新 参数 ， 该 参数 名 为 extensions 
， 是 PostgreSQL 9.6 中 引入 的 ， 它 可 以 用 来 提升 外 部 服务 器 的 访问 
性 能 。 要 想 用 上 此 特性 ， 请 按 如 下 语法 为 现 有 的 postgres_fdw 外 
部 服务 器 进行 参数 设置 : 


ALTER SERVER census(OPTION ADD extensions 'btree gist, pg trgm'); 


这 个 extensions 参数 的 内 容 是 一 个 用 逗号 分 隔 的 扩展 包 列 表 ， 它 
表示 远 端 PostgreSQL 服务 器 上 已 经 安装 了 哪些 扩展 包 。 当 
PostgreSQL 要 执行 的 语句 的 WHERE 条 件 中 涉及 扩展 包 中 定义 的 数 
据 类 型 或 者 函数 时 ， 系 统 会 尝试 将 这 些 函 数 调 用 推送 到 远 端 服务 器 
上 去 执行 ， 这 样 性 能 就 得 以 提升 。 如 果 未 设置 extensions 参数 ， 
所 有 扩展 包 中 的 函数 都 不 得 不 在 本 地 服务 器 上 执行 ， 这 就 意味 着 需 
要 先 把 所 有 相关 的 数据 从 远 端 服务 器 上 传输 到 本 地 ， 从 而 大 大 地 增 
加 了 要 通过 网 络 传输 的 数据 量 ， 速 度 自然 也 会 受 影响 。 


10.3.4 使 用 ogr_fdw 查询 其 他 二 维 表 形 式 的 数据 源 


有 许多 FDW 可 以 用 来 查询 其 他 关系 型 数据 库 或 者 平面 文件 数据 ， 
其 中 大 多 数 都 仅 支 持 某 种 特定 类 型 的 数据 源 。 例 如 ， 有 专门 用 于 查 
询 MongoDB 数据 的 MongoDB FDW， 有 专门 用 于 查询 Hadoop 数 
据 源 的 Hadoop FDW， 也 有 专门 用 于 碍 询 MySQL 数据 源 的 MySQL 
FDW。 


我 们 知道 有 两 种 FDW 能 够 支持 多 种 数据 源 。 第 一 个 是 Multicorn 
FDW， 它 事实 上 是 一 种 支持 用 户 以 Python 语言 编写 自 定义 FDW 
的 FDW API 平 台 。 已 经 有 一 些 基于 Multicorn FDW 平台 的 FPDW 
可 用 ， 但 该 平台 不 支持 Windows 而 且 在 Linux 上 用 起 来 也 问题 很 























多 ， 要 想 用 好 需要 一 些 技巧 。 


男 一 个 支持 多 种 数据 源 的 FDW 就 是 ogr_fdw ， 本 节 将 详细 展示 它 
的 用 法 。ogr_fdw 支持 很 多 二 维 表 形 式 的 数据 源 ， 例 如 电子 表格 

(比如 Excel 或 者 LibreOffice 等 ) 软件 使 用 的 表单 、Dbase 文件 、 
CSYV 文件 以 及 其 他 关系 型 数据 库 等 。 男 外 ， 它 还 支持 空间 数据 ， 可 
以 从 SQL Server、Oracle 等 关系 型 数据 库 把 数据 导入 到 PostGIS 并 
转换 为 PostgreSQL 几何 类 型 。 


有 些 PostGIS 的 安装 包 中 同时 也 会 附带 提供 ogr_fdw 扩展 包 。 例 
如 ，EnterpriseDB 公司 的 StackBuilder 安装 工具 中 提供 的 Windows 
版 PostGIS 包 里 面 束 附带 提供 了 ogr_fdw ; 在 CentOS 和 红 帽 
Linux 企业 版 (RHEL ) 操作 系统 中 ， 使 用 yum 一 站 式 安装 工具 从 
yum. postgresql.org 站 点 也 能 获取 到 ogr_fdw ; 在 BigSQL 公司 提 
供 的 PostgreSQL 发 行 版 安装 包 中 也 提供 了 ogr_fdw 。 如 果 你 希望 
根据 自行 编译 安装 ogr_fdw ， 可 以 从 GitHub 上 下 载 到 源码 。 


从 内 部 实现 机 制 来 看 ，ogr_fdw 其 实 是 利用 了 “地 理 空间 数据 抽象 
层 库 ”(Geospatial Data Abstraction Library，GDAL) 来 实现 上 述 强 
大 功能 。 因 此 ， 在 编译 或 者 使 用 ogr_fdw 之 前 ， 需 要 先 编译 并 安 
装 好 GDAL 库 。GDAL 库 历 史 悠 入 、 功 能 特性 繁多 ， 因 此 根据 不 
同 的 编译 选项 可 以 编译 出 多 种 多 样 的 能 力 组 合 。 因 此 请 注意 : 你 的 
GDAL 库 和 我 的 GDAL 库 有 可 能 差别 很 大 。GDAL 一 般 是 作为 
PostGIS 的 一 部 分 随 之 安装 ， 所 以 为 了 确保 在 使 用 GDAL 的 过 程 中 
不 会 遇 到 什么 问题 ， 我 们 建议 安装 最 新 版 本 的 PostGIS。 


GDAL 库 安 装 好 以 后 ， 一 般 都 目 带 对 Excel 表格 、LibreOffice Calc 
表格 、ODBC 数据 源 、 空 间 数 据 Web 服务 数据 源 的 支持 。 在 
Windows 上 它 一 般 还 会 支持 Microsoft Access 数据 源 ， 但 在 
Linux/Mac 下 一 般 不 会 文 持 。 


安装 好 ogr_fdw 的 二 进 制 安装 包 以 后 ， 连 到 PostgreSQL 上 要 安装 
ogr_fdw 的 database， 然 后 执行 以 下 命令 即 可 : 


CREATE EXTENSION ogr_fdw; 

















由 于 ogr_fdw 支持 多 种 多 样 的 外 部 数据 源 ， 因 此 针对 不 同 的 数据 
源 来 说 ， 外 部 服务 器 的 含义 也 是 不 一 样 的 。 比 如 对 于 CSYV 文件 来 
说 ，CSV 文件 所 在 的 目录 就 对 应 于 外 部 服务 器 ， 该 日 录 下 的 每 个 
CSV 文件 对 应 于 一 张 独立 的 外 表 ; 对 于 Microsoft Excel 和 
LibreOffice Calc 来 说 ， 一 张 工作 表 就 对 应 于 一 个 外 部 服务 器 ， 这 张 
工作 表 中 的 每 一 张 表单 束 对 应 于 一 个 独立 的 外 表 ; 对 于 SQLite 数 
据 库 来 说 ， 一 个 database 就 对 应 于 一 个 外 部 服务 器 ， 其 中 的 每 一 张 
表 束 对 应 一 个 独立 的 外 表 。 


在 下 面 的 例子 中 ， 我 们 把 一 个 LibreOffice 工作 表 映 射 为 一 个 外 部 
服务 器 ， 把 其 中 的 表单 映射 为 独立 的 外 表 : 








CREATE SERVER ogr_fdw wb 
FOREIGN DATA WRAPPER ogr_fdw 
OPTIONS ( 


datasource '/fdw data/Budget2615.0ds', 
format 'ODS' 
); 


CREATE SCHEMA wb_data; 
IMPORT FOREIGN SCHEMA ogr all 
FROM SERVER ogr_ fdw wb INTO wb_data; 





上 面 的 ogr_all 是 一 个 用 来 泛 指 所 有 schema 的 代称 而 非 真 实 的 
schema 名 ， 它 代 指 了 数据 源 中 所 有 的 schema， 其 作用 是 将 数据 源 
中 所 有 的 表 全 部 导入 ， 不 管 表 属 于 哪个 shema。 值 得 注意 的 一 点 
是 ， 有 的 外 部 数据 源 有 schema 概念 而 有 的 数据 源 没 有 。 为 了 适应 
各 种 数据 源 ， 当 数据 源 不 提供 schema 概念 时 ，ogr_fdw 可 以 接受 
一 个 虚拟 的 schema 名 〈 盾 在 上 例 中 ogr_all 出 现 的 位 置 ) ， 这 个 
虚拟 schema 名 其 实 是 表 名 前 经， 也 就 是 说 ， 所 有 名 字符 合 此 前 级 
的 表 都 被 认为 属于 该 虚拟 的 scthema， 从 而 可 以 被 一 次 性 导入 。 例 
如 ， 如 果 和 希望 一 次 性 把 所 有 名 字 以 “Finance” 开 头 的 表单 导入 进来 ， 
那么 可 以 把 上 面 脚 本 中 的 ogr_all 蔡 换 为 "Finance”: 











CREATE SCHEMA wb_data; 
IMPORT FOREIGN SCHEMA "Finance" 
FROM SERVER ogr_fdw wb INTO wb_data; 


schema 的 名 字 是 区 分 大 小 写 的 ， 因 此 如 果 表 单 的 名 字 中 含有 大 写 
字符 或 者 非 标准 字符 ， 需 要 在 其 前 后 加 引号 。 


下 一 个 例子 是 对 一 个 存 有 CSYV 文件 的 目录 创建 外 部 数据 源 服 务 
器 。 创 建 一 个 名 为 ff 的 schema 来 容纳 外 部 表 。ogr_fdw 会 在 ff 
这 个 schema 中 自动 针对 每 个 名 字 以 Housing 开头 的 CSV 文件 创建 
外 表 。 脚 本 如 下 : 





CREATE SERVER ogr fdw ff 

FOREIGN DATA WRAPPER ogr_fdw 

OPTIONS (datasource '/fdw data/factfinder', format 'CSV'); 
CREATE SCHEMA ff; 


IMPORT FOREIGN SCHEMA "Housing" 
FROM SERVER ogr fdw ff INTO ff; 





假设 在 上 例 的 目录 中 有 Housing_2015.csv 和 Housing_2016.csv 这 两 
个 文件 ， 那 么 系统 会 为 它们 在 schema ff 中 各 建 一 个 外 表 ， 表 名 为 
housing _ 2615 和 housing 2616 。 


ogr_fdw 默认 会 对 外 部 数据 源 中 的 表 名 和 字段 名 进行 转换 : 所 有 大 
写 的 表 名 和 字段 名 都 会 被 修改 为 小 写 。 如 果 你 不 希望 发 生 这 种 转 
换 ， 可 以 在 IMPORT FOREIGN SCHEMA 命令 中 加 上 一 些 参数 ， 来 使 
得 外 部 数据 源 的 表 名 和 字段 名 维持 原样 不 变 。 例 如 : 

















IMPORT FOREIGN SCHEMA "Housing" 
FROM SERVER ogr_fdw ff INTO ff 


OPTIONS(launder table names 'false', launder column names 'false' 





这 个 语句 创建 出 来 的 外 表 名 就 是 Housing 2615 和 Housing 2616 
， 与 外 部 数据 源 中 的 原始 表 名 保持 一 致 。 


10.3.5 ”查询 非 传统 数据 源 


长 久 以 来 ， 数 据 库 界 多 元 化 的 趋势 有 增 无 减 ， 各 种 架构 大 相 径 星 的 
数据 库 如 雨后春笋 般 层 出 不 穷 ， 要 想 紧 跟 业 界 漳 流 十 分 困难 。 这 些 








异彩 纷呈 的 数据 库 中 ， 有 的 只 是 县 花 一 现 ， 哈 闹 一 阵子 就 消失 无 
踩 ， 有 的 立志 要 将 传统 的 关系 型 数据 库 挑 落马 下 ， 更 有 另类 者 其 至 
看 起 来 根本 就 不 像 是 数据 库 。FDW 功能 的 引入 就 是 PostgreSQL 对 
这 一 百花 齐 放 局 面 的 应 对 策略 之 一 。 不 管 外 界 如 何 风云 变 约 ， 
PostgreSQL 无 须 改 变 上 自身 的 核心 功能 ， 而 是 通过 FDW 搭建 与 这 些 
异 构 数 据 库 之 间 沟 通 的 桥梁 。 


在 下 面 的 例子 中 ， 我 们 将 展示 如 何 使 用 www_fdw 来 查询 来 自 Web 
服务 的 数据 。 该 示例 是 从 www_fdw Examples 站 点 借鉴 而 来 的 。 


PostgreSQL 发 行 包 是 不 附带 www_fdw 的 ， 因 此 需要 自行 编译 安 
装 。 如 果 你 使 用 的 是 Linux/Unix 环境 并 且 已 安装 了 postsql-dev 
这 个 包 ， 那 么 编译 是 很 容易 的 。 请 从 
https://github.com/cyga/www_fdw 下 载 最 新 版 本 的 www_fdw 源码 。 
对 于 Windows 平台 来 说 ， 我 们 已 经 蔡 你 编译 好 了 ， 下 载 链 接 如 
下 : 


Windows-32 
9.1 (http:/www.postgresonline.com/downloads/fdw_win32_91 bin.zip 


) 


























Windows-64 
9.3 (http:/www.postgresonline.com/downloads/fdw_win64 93_bin.zip 


) 
首先 安装 FDW 扩展 包 。 


CREATE EXTENSION www_fdw; 


然后 创建 针对 Google Web 服务 的 外 部 服务 器 。 


CREATE SERVER www_ fdw_ server google search 
FOREIGN DATA WRAPPER www_fdw 


OPTIONS(uri 'http://ajax.googleapis.com/ajax/services/search/web?v 





www_fdw 默认 支持 JSON 格式 数据 源 ， 因 此 我 们 不 需要 在 上 述 语句 
的 OPTIONS 修饰 符 中 特地 声明 数据 源 格式 。 此 外 www_fdw 还 文 持 
XML 格式 数据 源 。 如 果 想 了 解 www_fdw 所 支持 的 形 参 的 详细 信 
息 ， 请 参阅 其 官方 文档 www_fdw 。 请 注意 : 每 一 个 FDW 都 有 其 独 
特 的 设置 ， 互 不 相同 。 


接 下 来 选 定 至 少 一 个 本 地 角色 来 创建 FDW 用 户 映射 关系 。 每 个 能 


连 到 本 地 库 上 的 用 户 都 应 该 有 权限 访问 Google 搜索 服务 器 ， 因 此 
我 们 将 远 端 数据 源 的 访问 权限 映射 给 本 地 的 public 角色 。 


CREATE USER MAPPING FOR public SERVER Www_ fdw_ server google search; 


然后 创建 外 部 表 ， 如 示例 10-5 所 示 。 表 中 每 个 字段 对 应 于 Google 
目 动 生成 的 URL 搜索 路 径 中 的 一 个 GET 参数 。 


示例 10-5 ”基于 Google Web 服务 数据 源 创建 一 个 外 部 表 








CREATE FOREIGN TABLE www_ fdw google search (人 
q text, 
GsearchResultClass text， 
unescapedUrl text, 
url text, 
visibleUrl text, 
cacheUrl text, 
title text, 
content text 


) SERVER www_ fdw_ server google search,; 











前 面 设置 用 户 映 财 关 系 时 未 指定 任何 权限 ， 因 此 需要 进行 一 次 授权 
动作 ， 然 后 才 可 以 访问 外 部 表 。 


GRANT SELECT ON TABLE www_ fdw_ google search TO public; 


请 注意 ， 现 在 最 精彩 的 部 分 来 了 : 我 们 以 New in PostgreSQL 
16 作为 关键 词 进行 搜索 ， 并 用 正则 表达 式 筛 选 掉 返 回 结果 中 的 


HTML 标签 ， 语 句 如 下 所 示 。 


SELECT regexp_ replace(title,E'(?x)(< [^>]*? >)','','g') As title 
FROM www_fdw google search 
WHERE q= 'New in PostgreSQL 16， 


LIMIT 2; 








瞧 吧 ! 我 们 真 的 得 到 了 想 要 的 搜索 结果 。 


PostgreSQL 16 Roadmap 


PostgreSQL: Roadmap 
(2 rows) 





0 附录 A ” PostgreSQL 的 安装 


A.1 Windows 以 及 桌面 Linux 环 境 


EnterpriseDB 公司 为 Windows 和 桌面 Linux 环境 提供 了 安装 包 ， 而 
且 针 对 每 种 OS 都 同时 提供 了 32 位 和 64 位 的 包 。 


基于 图 形 化 界面 的 安装 包 使 用 起 来 非常 简单 ， 其 中 还 附带 了 
pgAdmin 以 及 一 款 辅助 安装 工具 StackBuilder。 通 过 StackBuilder， 
可 以 为 PostgreSQL 安装 一 些 插件 和 辅助 工具 ， 比 如 JDBC 豫 

动 、.NET 驱动 、Ruby 驱动 、PostGIS、phpPgAdmin 管理 工具 和 
pgAgent 任务 调度 器 等 。 


EnterpriseDB 提供 了 两 个 版 本 的 PostgreSQL 安装 包 : 一 个 是 官方 开 
源 版 ， 也 叫 社 区 版 ; 另 一 个 是 商业 版 ， 也 叫 Advanced Plus 版 。 后 
者 提供 了 对 Oracle 语法 的 兼容 以 及 一 些 比 社区 版 更 强大 的 管理 功 
能 。 这 两 个 版 本 是 有 区 别 的 ， 下 载 时 请 勿 和 弄 错 。 本 书 中 讨论 的 所 有 
内 容 都 是 针对 官方 开源 版 ， 而 非 闭 源 的 Postgres Plus Advanced 
Server 版 。 不 过 由 于 二 者 出 自 同 源 ， 所 以 本 书 绝 大 部 分 内 容 对 于 后 
者 也 是 适用 的 。 


BigSQL 是 一 个 开源 的 PostgreSQL 发 行 版 ， 其 开发 工作 主要 由 
OpenSCG 公司 赞助 。BigSQL 发 行 版 与 EnterpriseDB 公司 的 发 行 版 
类 似 ， 二 者 都 提供 Windows、Linux 和 Mac 下 的 64 位 安装 包 。 


BigSQL 发 行 版 的 历史 没有 EnterpriseDB 发 行 版 那么 悠久 ， 其 目标 
是 致力 于 提升 PostgreSQL 的 互 操作 性 、DevOps 能 力 以 及 大 数据 处 
理 能 力 。 因 此 ， 我 们 可 以 在 该 发 行 版 中 看 到 一 些 其 他 发 行 版 一 般 不 
会 原生 提供 的 扩展 包 ， 比 如 pgTSQL， 这 是 一 个 与 Microsoft SQL 
Server 的 T-SQL 语法 相同 的 过 程式 语言 扩展 ; 另外 还 含有 一 些 用 于 
性 能 测评 和 系统 监控 的 扩展 包 ， 比 如 pgBadger。 


该 发 行 版 还 自 带 了 功能 增强 的 扩展 包 ， 比 如 PostGIS (包括 
ogr_fdw ) 和 hadoop fdw、cassandra fdw 、oracle fdw 等 


扩展 包 ， 男 外 还 有 很 多 过 程式 语言 扩展 包 。 














同 EnterpriseDB 一 样 ，BigSQL 也 有 它 自 己 的 包 管 理 器 。 该 包 管理 
器 可 以 通过 Web 页面 调用 ， 也 可 以 通过 一 个 名 为 pgc 的 命令 行 工 
具 调 用 ，pgc 的 含义 是 “非常 好 的 命令 行 工 具 ”(pretty good 
command-line) 。pgc 包 管 理工 具 的 用 法 与 Linux 下 的 yum、apt- 
get 等 包 管 理工 具 相 同 ， 即 使 在 Windows 环境 下 用 法 也 是 一 样 。 
此 如 果 要 安装 新 的 包 ， 请 先 打 开 一 个 新 的 命令 行 窗口 ， 然 后 把 目录 
切换 到 BigSQL 的 安装 目录 。 


更 新 并 但 看 本 地 包 列 表 : 


pgc update 
pgc list 





输出 列表 如 下 : 


Category | Component | Version | ReleaseDt | Status 
PostgreSQL pg92 9.2.21-1 2617-65-11 

PostgreSQL pg93 .3.17-1 2617-65-11 

PostgreSQL pg94 2017-65-11 

PostgreSQL pg925 2017-65-11 

PostgreSQL pg96 2617-65-11 Installed 
Extensions cassandra_fdw3-pg96 26016-11-68 

Extensions hadoop_fdw2-pg96 26016-69-61 

Extensions oracle fdw1l-pg96 26016-69-61 

Extensions orafce3-pg96 2016-69-23 

Extensions pgaudit11-pg96 26017-65-18 

Extensions pgpartman2-pg96 2017-64-15 

Extensions pldebugger96-pg96 2616-12-28 

Extensions plprofiler3-pg96 2617-64-15 

Extensions postgis23-pg96 2017-65-18 Installed 
Extensions setuser1-pg96 2017-02-23 

Extensions tds_fdw1-pg96 26016-11-23 

Servers pgdevops 26017-65-18 Installed 
Applications backrest 26017-65-18 
Applications ora2pg 2017-03-23 
Applications pgadmin3 26016-16-26 Installed 
Applications pgagent 26017-62-23 
Applications pgbadger 26017-62-69 

Frameworks java8 26017-62-69 

Frameworks per15 20616-63-14 

Frameworks python2 2616-16-26 Installed 
Frameworks tcl86 2616-63-11 
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安装 一 个 包 : 


pgc install pgdevops 


pgDevops 包 是 一 个 基于 Web 的 管理 工具 ， 其 中 包含 了 pgAdmin4 
以 及 用 于 安装 和 监控 BigSQL 相关 包 的 管理 界面 。 


安装 好 以 后 ， 请 执行 : 


pgc init pgdevops 
pgc start pgdevops 





装 好 以 后 默认 的 访问 路 径 是 : http://localhost:8051。 


如 需 升 级 一 个 现 有 的 包 ， 请 使 用 pgc _ upgrade 代替 pgc install 





本 如 有 果 和 希望 在 同一 台 机 器 上 免 安 装 试用 一 下 不 同 版 本 的 
PostgreSQL ， 或 者 是 希望 从 USB 设备 启动 PostgreSQL， 
EnterpriseDB 和 BigSQL 均 提 供 了 一 种 免 安 装 的 解决 方案 。 
EnterpriseDB 方案 的 具体 内 容 请 参考 “Starting PostgreSQL in 
Windows without Install” 这 篇 文章 。 


01. A.2 CentOS、 Fedora、 Red Hat 以 及 Scientific 
Linux 


大 多 数 Linux/Unix 发 行 版 会 在 其 软件 仓库 中 提供 PostgreSQL， 但 
版 本 可 能 比较 老 。 为 了 解决 这 个 问题 ， 很 多 人 会 使 用 逆向 移植 工 的 
0 这 种 版 本 包 的 软件 仓库 中 会 提供 较 新 版 本 的 PostgreSQL 
人 o 


1“ 道 向 移植 ”英文 为 backport， 是 指 将 新 版 本 的 软件 、 工 具 软 件 、 补 
丁 包 等 一 一 逆向 移植 到 老 版 本 的 操作 系统 上 ， 这 冬 机 建 出 来 的 版 本 包 既 能 维 著 平 台 兼容 
性 ， 叉 能 提供 新 的 软件 特性 ， 从 而 以 最 小 的 代价 解决 了 老 版 本 软件 存在 的 问题 ， 与 全 面 
升级 操作 系统 平台 相 比 ， 这 是 一 种 兼容 性 好 、 风 险 低 的 解决 方案 。 一 一 译 者 注 






























































对 于 具有 冒险 精神 的 Linux 用 户 来 说 ， 可 以 从 PostgreSQL Yum 仓 
库 下 载 最 新 版 本 的 PostgreSQL， 包 括 开 发 中 的 版 本 。 此 仓库 中 不 仅 
包含 PostgreSQL 服务 器 核心 组 件 ， 还 包含 比较 常用 的 扩展 包 。 
PostgreSQL 的 开发 团队 负责 维护 这 个 仓库 ， 并 且 会 在 第 一 时 间 发 布 
补丁 和 版 本 更 新 。PostgreSQL Yum 仓库 一 般 会 存储 最 近 的 2~4 个 
稳定 版 PostgreSQL， 文 持 的 操作 系统 平台 包括 CentOS、RedHat 
EL、 Fedora、 Scientific Linux、Amazon AMI 以 及 Oracle 

Enterprise。 


如 果 使 用 的 操作 系统 平台 较 老 或 者 是 仍 需 要 生命 周期 已 经 结束 的 老 
版 本 PostgreSQL， 那 么 是 无 法 使 用 最 新 的 PostgreSQL Yum 仓库 
的 ， 请 查阅 文档 了 解 下 哪些 软件 仓库 中 仍然 在 维护 老 版 本 的 
PostgreSQL 。 如 果 和 希望 了 解 更 多 基于 Yum 的 软件 安装 机 制 ， 请 参 
考 我 们 的 PostgresOnline 网 站 上 关于 Yum 的 内 容 。 





01. A.3 “Debian 和 Ubuntu 


Debian 和 Ubuntu 上 可 以 使 用 apt-postgresql 仓库 来 安装 最 新 的 稳定 
版 或 者 开发 版 PostgreSQL 。apt-postgresql 也 是 个 软件 仓库 ， 其 作用 
与 PostgreSQL 开发 组 上 自己 维护 的 yum postgresql 软件 仓库 类 似 。 
Ubuntu 和 Debian 自身 的 默认 软件 仓库 中 一 般 也 会 提供 最 新 的 稳定 
版 PostgreSQL 。 典 型 的 安装 命令 如 下 : 


sudo apt-get install postgresql-9.6 


如 有 果 你 需要 编译 软件 仓库 中 未 提供 的 扩展 包 ， 需 要 先 安 装 
postgresql-server-dev 开发 库 ， 命 令 如 下 : 


sudo apt-get install postgresql-server-dev-9.6 


如 果 你 的 操作 系统 的 默认 软件 仓库 中 未 包含 最 新 版 本 的 
PostgreSQL， 那 么 请 访问 Apt PostgreSQL packages 站 点 以 获取 最 新 
的 稳定 版 或 者 测试 版 PostgreSQL。 该 站 点 同时 还 提供 一 些 其 他 的 安 
装 包 ， 比 如 PL/V8 和 PostGIS 等 。 该 站 点 的 软件 包 所 支持 的 操作 系 
统一 般 包 含 Debian 和 Ubuntu 的 最 近 2~3 个 版 本 。 





01. A.4 FreeBSD 


FreeBSD 是 一 个 常用 的 PostgreSQL 平台 。 你 可 以 从 
http://www.freebsd.org/ports/database.html 获取 到 最 新 的 适用 于 
FreeBSD 平台 的 PostgreSQL， 然 后 通过 FreeBSD 的 包 管 理 系统 来 


01. A.5 macOsS 


在 Mac 机 器 上 安装 PostgreSQL 有 很 多 方法 : EnterpriseDB 和 
BigSQL 均 提 供 了 独立 安装 包 ; Homebrew 包 管 理 器 使 用 得 越 来 越 
广泛 ， 并 且 已 经 吸引 了 一 些 高 级 Mac 用 户 ; Postgres. app 是 Heroku 
封装 的 一 个 发 行 包 ， 在 新 手 用 户 中 很 流行 ， 男 外 历史 悠久 的 
MacPorts 和 Fink 这 两 个 软件 及 布 平台 也 还 在 继续 提供 服务 。 可 以 
看 到 ，Mac 可 用 的 安装 源 很 多 ， 但 我 们 建议 Mac 用 户 最 好 从 相同 
的 数据 源 下 载 安装 包 。 比 如 ， 你 使 用 BigSQL 提供 的 安装 包 安 装 了 
PostgreSQL， 那 么 最 好 不 要 用 EnterpriseDB 的 StackBuilder 包 管 理 














工具 来 安装 扩展 包 ， 因 为 可 能 会 出 现 兼容 性 问题 。 
以 下 列 出 了 每 个 安装 源 的 详细 信息 。 


EnterpriseDB 公司 为 macOS 提供 了 一 个 非常 易 用 的 一 键 式 
PostgreSQL 安装 包 ， 附 禹 了 pgAdmin 管理 工具 。 此 外 该 公司 
还 提供 了 一 个 名 为 StackBuilder 的 软件 ， 通 过 它 可 以 下 载 常 用 
扩展 包 、 驱 动 程 序 、 编 程 语 言 扩 展 以 及 管理 工具 等 。 

BigSQL 也 提供 了 一 个 非常 易 用 的 一 键 式 安 装 包 ， 支 持 64 位 
macOS。 如 需 安 装 扩 展 包 ，BigSQL 提供 了 一 个 名 为 pgc 的 命 
令 行 工具 以 及 一 个 名 为 pgDevops 的 Web 管理 工具 ， 其 详情 
A.1l 节 已 经 讨论 过 。 通 过 它 可 以 下 载 常 用 扩展 包 、 了 驱动 程序 、 
编程 语言 扩展 以 及 管理 工具 等 。BigSQL 当前 在 非 Windows 环 
境 中 支持 PL/V8 扩展 包 。 

Homebrew 是 macOS 下 的 一 个 安装 包 管 理 器 ， 文 持 包括 
PostgreSQL 在 内 的 很 多 软件 的 安装 管理 。 “PostgreSQL， 
Homebrew, and You” 这 篇 博客 文章 介绍 了 如 何 使 用 Homebrew 
来 安装 PostgreSQL 。 你 还 能 在 Homebrew PostgreSQL Wiki 站 
点 看 到 大 量 有 价值 的 相关 文章 。 

由 Heroku 开发 团队 提供 的 PostgreSQL.app 是 一 个 免费 的 桌面 
应 用 安装 包 ， 号 称 是 Mac 平台 上 最 方便 易 用 的 PostgreSQL 安 
装 包 。 该 安装 包 一 般 都 是 基于 最 新 版 本 的 PostgreSQL 构建 ， 
其 中 还 附带 了 常用 的 扩展 包 ， 比 如 PostGIS、PL/Python 和 
PL/V8 等 。Postgres.app 作为 一 个 独立 的 应 用 程序 运行 ， 可 以 
按 需 启动 和 停止 ， 非 常 适 合用 于 开发 ， 也 适用 于 单 用 户 场 景 。 
MacPorts 是 macOS 平台 上 的 一 个 软件 发 布 平台 ， 支 持 大 量 的 























开源 软件 ， 可 以 实现 软件 包 的 编译 、 安 装 、 升 级 等 操作 。 它 是 
Mac 操作 系统 上 最 早 文 持 PostgreSQL 的 软件 发 布 平台 。 

。 Fink 是 macOS 上 的 另 一 个 软件 发 布 平 台 ， 底 层 基 于 Debian 的 
apt-get 软件 安装 框架 。 


0. 附录 B PostgreSQL 目 市 的 命令 


pg 
行 工 具 

以 下 内 容 集中 介绍 了 PostgreSQL 的 必 备 命令 行 工 具 ， 本 书 的 正文 
部 分 已 经 对 它们 的 功能 进行 了 翔实 的 介绍 ， 此 处 仅 列 出 它们 的 帮助 
信息 。 我 们 希望 通过 提供 这 部 分 内 容 为 你 节省 一 些 时 间 ， 也 希望 能 
让 这 本 书 成 为 你 更 好 的 工作 助手 。 





01. B.1 使 用 pg dump 进行 数据 库 备 份 


pg_dump 可 备份 一 个 database 的 全 部 或 者 部 分 数据 。 文 持 的 备份 格 
式 有 : TAR 包 格 式 、PostgreSQL 自 定 义 压缩 格式 、 纯 文本 格式 以 
及 SQL 文本 格式 。 纯 文本 格式 转 储 的 内 容 中 含有 psql 专 有 命令 

行 ， 因 此 恢复 时 也 需要 通过 psql 工具 :来 执行 此 文本 。 SQL 文本 格 
式 转 储 的 是 仅 包含 标准 CREATE 和 INSERT 命令 的 SQL 脚本 ， 恢 复 
时 你 可 以 使 用 bsql 3 或 者 pgAdmin 工具 来 运行 该 脚本 。 示 例 B-1 显 
示 的 是 pg _dump 命 合 令 令 的 帮助 信息 。 如 果 要 了 解 pg_dump 的 全 部 用 
法 ， 请 参见 2.7.1 节 。 





示例 B-1 pg _dump 帮助 信息 


pg_dump --help 


pg_dump 可 将 某 个 database 转 储 为 文本 文件 或 者 其 他 格式 文件 。 
用 法 : 
pg_dump [选项 ]... [database 名 ] 














通用 选项 : 

-f, --file=FILENAME 输出 文件 名 或 者 目录 名 
-F, --format=c|d|t|p 输出 文件 格式 (上 自 定义 格式 、 目 录 格 式 、TAR 包 
本 ) 

-j，--jobs=NUM 使 用 这 多 个 并 行 作业 进行 转 储 
-V，--verbose 详细 信息 模式 

-Z，--compress=6-9 压缩 格式 的 压缩 级 别 
--lock-wait-timeout=TIMEOUT 等 待 表 锁 超时 后 操作 失败 

--no-sync 不 等 待 变更 安全 写 入 磁盘 @ 

--help 显示 此 帮助 信息 并 退出 

--version 输出 版 本 信息 并 退出 

控制 输出 内 容 的 选项 : 

-a, --data-only 仅 转 储 数据 ， 而 不 转 储 schema 
-b，--blobs 在 转 储 中 包含 大 对 象 

-B，--no-blobs 不 对 大 对 象 进行 备份 ”名 

-C，--clean | 《删除 ) 数 
-C，--create 含 用 于 在 转 储 中 创建 数据 库 的 命令 

-E, --encoding=ENCODING oo 
-n，--schema=SCHEMA 仅 转 储 命名 schema 
-N，--exclude-schema=SCHEMA 不 转 储 命 名 schema 
-0，--oids 在 转 储 中 包含 0ID 
-0，--no-owner 以 纯 文 本 格式 跳 过 对 象 所 有 权 的 恢复 
-s, --schema-only 仪 转 储 schema， 而 不 转 储 数据 









































































































































-S，--superuser=NAME 要 以 纯 文 本 格式 使 用 的 超级 用 户 名 











































































































-七 ，- -tab1le=TABLE 仅 转 储 命名 表 

-T，--exclude-table=TABLE 不 转 储 命名 表 

-xX，--no-privileges 不 转 储 特权 (grant/revoke) 
--binary-upgrade 仅 供 升级 工具 使 用 

--column-inserts 以 带 有 列 名 的 INSERT 命 令 的 形式 转 储 数据 
--disable-dollar-quoting 禁用 美元 〈 符 号 ) 引号， 而 是 使 用 SsQL 标 准 引 号 
--disable-triggers 在 仅 恢 复数 据 期 间 禁 用 触发 器 
--enable-row-security 启用 行 级 安全 控制 〈 只 导出 用 户 有 权 访 问 的 数 志 
--exclude-table-data=TABLE 不 转 储 命名 表 中 的 数据 

--if-exists 删除 对 象 时 使 用 IF EXISTS 

--inserts 以 INSERT 命 令 〈 而 非 COPY 命 令 ) 的 形式 转 储 数 
--no-publications 不 导出 逻辑 复制 发 布 端 数 据 源 定义 @ 
--no-security-labels 不 转 储 安全 标签 分 配 

--no-subscriptions 不 导出 逻辑 复制 订阅 端的 数据 订阅 定义 全 
--no-synchronized-snapshots 在 并 行 作业 中 不 使 用 同步 快照 
--no-tablespaces 不 转 储 表 空 间 分 配 
--no-unlogged-table-data 不 转 储 不 记录 WAL 日 志 的 表 的 数据 
--quote-all-identifiers 所 有 标识 符 加 引号 ， 即 使 不 是 关键 字 也 加 
--section=SECTION 转 储 命名 部 分 (包括 三 个 部 分 : pre-data、da 














-data。data 部 分 包含 表 记 录 数 据 、 大 对 象 数据 
值 ; post-data 部 分 包含 索引 、 触 发 器 、 规 则 和 
验证 检查 约束 ) 的 定义 ;pre- dat3 部 分 包含 此 





































































































的 对 象 定 义 ) 
--serializable-deferrable 等 待 直至 转 储 正常 运行 为 止 
--snapshot=SNAPSHOT 为 导出 使 用 指定 的 快照 @ 
--strict-names 要 求 每 个 表 和 /或 schema 包 括 模式 以 匹配 至 少 一 
--Use-set-session-authorization 使 用 SESSION AUTHORIZATION 命令 代替 ALTE 
命令 来 设置 所 有 权 
连接 选项 : 
-d, --dbname=DBNAME 要 转 储 的 数据 库 
-h，--host= 主 机 名 数据 库 人 
-p，--port= 端 口号 数据 库 服务 器 端口 
-U，--username= 名 称 作为 指定 数据 库 用 户 连接 
-Ww, --no-password 永远 不 提示 输入 密码 
-W, --password 强制 要 求 输入 密码 (应 该 自动 发 生 ) 
- -role=ROLENAME 在 转 储 之 前 执行 SET ROLE 命 令 








OQ@E@ PostgreSQL 10 中 引入 的 新 特性 。 
@ PostgreSQL 9.6 中 引入 的 新 特性 
@@@ PostgreSQL 9.5 中 引入 的 新 特性 


@ PostgreSQL 9.4 中 引入 的 新 特性 。 


01. 


B.2 服务 器 级 备份 工具 pg_dumpall 


使 用 pg_dumpall 工具 可 以 将 服务 器 上 的 所 有 数据 库 备份 到 单个 纯 
文本 文件 或 者 单个 纯 文 本 SQL Ma 该 备份 工具 将 目 动 备份 角 
色 和 表 空 间 等 系统 级 对 象 的 信息 ， 这 类 信息 不 属于 任何 一 个 数据 
库 。 示 例 B-2 列 出 了 pg_dumpall 的 所 有 帮助 信息 。pg_dumpal1 
的 具体 用 法 请 参考 2.7.2 节 。 


示例 B-2 pg_dumpall 帮助 信息 





pg_dumpall --help 











pg_dumpal1 可 以 将 一 个 PostgreSQL 数 据 库 集群 中 的 所 有 数据 都 提取 到 一 个 SQL 脚本 文 { 

















;去 : 


pg_dumpall [选项 ] . . . 

















选项 : 

--file=FILENAME 输出 文件 名 

--verbose 详细 模式 

--version 输出 版 本 信息 ， 然 后 退出 
--lock-wait-timeout=TIMEOUT 等 待 表 锁 超时 后 操作 失败 
-?，--help 显示 此 帮助 信息 并 退出 


控制 输出 内 容 的 选项 : 
-a, --data-only 仅 转 储 数据 ， 而 不 转 储 schema 
-C，--clean 重新 创建 数据 库 之 前 清除 〈 删 除 ) 数据 库 
-g, --globals-only 仅 转 储 全 局 对 象 ， 而 不 转 储 数据 库 
-0，--oids 在 转 储 中 包含 OID 
-0，--no-owner 以 纯 文本 格式 跳 过 对 象 所 有 权 的 恢复 
-r,--roles-only 仅 转 储 角色 ， 而 不 转 储 数据 库 和 表 空 间 
-s, --schema-only 仅 转 储 schema， 而 不 转 储 数据 
-S，--superuser=NAME 要 在 转 储 中 使 用 的 超级 用 户 名 

-t, --tablespaces-only 仪 转 储 表 空间 ， 而 不 转 储 数据 库 和 角色 
-Xx, --no-privileges 不 转 储 特权 (grant/revoke) 
--binary-upgrade 仅 供 升 级 工具 使 用 
--column-inserts 以 带 有 和 列 名 的 INSERT 命 令 令 的 形式 转 储 数据 
--disable-dollar-quoting 禁用 美元 符号) 引号 ， 而 是 使 用 SQL 标准 引 
--disable-triggers 在 仅 恢 复数 据 期 间 禁 用 触发 器 

--inserts 以 INSERT 命 令 “〈 而 非 COPY 命 令 ) 的 形式 转 信 
--no-publications 不 导出 逻辑 复制 发 布 端 数 据 源 定义 @ 
--no-security-labels 不 转 储 安全 标签 的 分 配 
--no-subscriptions 不 导出 逻辑 复制 订阅 端的 数据 订阅 定义 名 
--no-sync 不 等 待 变更 安全 写 入 磁盘 合 



























































































































































































































































--no-security-labels 
--no-tablespaces 
--no-unlogged-table-data 
--no-role-passwords 
--quote-all-identifiers 
--Use-set-session-authorization 


连接 选项 : 
-d，--dbname=CONNSTR 
-h，--host= 主 机 名 

-1, --database=DBNAME 
-p，--port= 端 口号 
-U，--username= 名 称 
-W，--no-password 
-NW，--password 
--role=ROLENAME 











如 果 未 使 用 -f/--file， 则 会 将 SQL 脚 本 写 到 标准 输出 中 。 





不 转 储 安全 标签 分 配 
不 转 储 表 空 间 分 配 














不 转 储 不 记录 WAL 日 志 的 表 的 数据 

不 转 储 角色 的 密码 © 

所 有 标识 符 加 引号 ， 即 使 不 是 关键 字 也 加 
使 用 SET SESSION AUTHORIZATION 命 令 代 者 
命令 来 设置 所 有 权 


























使 用 连接 连接 上 














串 连 接 








数据 库 服务 器 主机 或 套 接 字 目 录 





蔡 代 默认 数据 库 





数据 库 服务 器 端 








口号 


作为 指定 数据 库 用 户 连接 








永远 不 提示 输入 密码 








强制 要 求 输入 密码 (应 该 自动 发 生 
在 转 储 之 前 执行 SET ROLE 命 令 




















OQ PostgreSQL 10 中 引入 的 新 特性 








.也 .3 database 数 据 恢复 工具 pg_restore 


可 以 使 用 pg_restore 可 恢复 使 用 pg_dump 创建 的 备份 文件 ， 这 
些 备 份 文件 的 格式 包括 TAR 包 桥 式 、 目 定 义 压缩 格式 以 及 目录 格 
式 等 。 示 例 B-3 是 Pe ore 命令 令 的 帮助 信息 。 更 多 有 关 使 用 
pg_restore 的 实例 ， 请 参见 2.7.3 节 。 


示例 B-3” pg_restore 帮助 信息 


pg_restore --help 











pg_restore 可 以 从 pg_dump 创 建 的 存档 中 恢复 一 个 PostgresQL 数 据 库 。 用 法 : 
pg_restore [选项 ]... [文件 名 ] 





























通用 选项 : 

-d, --dbname=NAME 连接 到 数据 库 名 称 
-f，--file= 文 件 名 输出 文件 名 

-F, --format=c|d|t 备份 文件 格式 (应 该 是 自 
-1，--1ist 打印 存档 的 汇总 目录 
-V，--verbose 详细 信息 模式 
-V，--version 输出 版 本 信息 并 退出 
-?，--help 显示 此 帮助 信息 并 退出 


恢复 控制 选项 ; 

-a, --data-only 仅 恢 复数 据 ， 而 不 恢复 schema 

-C，--clean 在 重新 创建 数据 库 对 象 之 前 清除 〈 删 除 ) 数据 库 对 
-C, --create 创建 目标 数据 库 
-e, --exit-on-error 恢复 期 间 发 生 错 误 时 退出 ， 知 不 设 定 则 默认 为 继续 
-I，--index=NAME 恢复 命名 索引 

-j，--jobs=NUM 使 用 这 多 个 并 行 作 业 进 行 恢复 
-L，--use-1ist=FILENAME 将 此 文件 的 目录 用 于 选择 输出 或 对 输出 进行 排序 
-n，--schema=NAME 仅 恢 复 此 schema 中 的 对 象 
-N，--exclude-schema=NAME 不 恢复 该 schema 中 的 对 象 @ 

-0，--no-owner 跳 过 对 象 所 有 权 的 恢复 

-P, --function=NAME (args) 恢复 命名 函数 

-s, --schema-only 仅 恢 复 schema， 而 不 恢复 数据 
-S，--superuser=NAME 于 禁用 触发 器 的 超级 用 户 名 
-t, --table=NAME 恢复 命名 表 〈 含 表 和 视图 等 ) @ 
-T，--trigger=NAME 恢复 命名 触发 器 
-X，--no-privileges 跳 过 访问 特权 (grant/revoke) 的 恢复 
-1, --single-transaction 作为 单个 事务 恢复 
--enable-row-security 启用 行 安全 性 合 
--disable-triggers 在 仅 恢 复数 据 期 间 禁 用 触发 器 


















































































































































































































































--no-data-for-failed-tables ”如 果 表 创建 失败 ， 则 不 对 其 进行 数据 恢复 
--no-publications ` 导 出 逻辑 复制 发 布 端 数 据 源 定义 @ 
--no-security-labels 不 恢复 安全 标签 

--no-subscriptions 不 导出 逻辑 复制 订阅 端的 数据 订阅 定义 全 
--no-tablespaces 不 恢复 表 空 间 分 配 

--section=SECTION 恢复 命名 部 分 (包括 三 个 部 分 : pre-data、data 














data。data 部 分 包含 表 记 录 数 据 、 大 对 象 数 据 以 
值 ，post-data 部 分 包含 索引 、 触 发 器 、 规 则 和 约 
验证 检查 约束 ) 的 定义 ;pre-data 部 分 包含 此 外 
的 对 象 定 义 ) 











--strict-names 要 求 每 个 表 和 /或 schema 包 括 模式 以 匹配 至 少 一 个 





--Use-set-session-authorization 使 用 SET SESSION AUTHORIZATION 命 令 
OWNER 命 令 来 设置 所 有 权 





连接 选项 : 
-h，--host= 主 机 名 数据 库 服务 器 主机 或 套 接 字 目 录 

















-p，--port= 端 口号 数据 库 服务 器 端口 号 
-U，--username= 名 称 作为 指定 数据 库 用 户 连接 
-W，--no-password 永远 不 提示 输入 密码 

-W, --password 强制 要 求 输入 密码 (应 该 自动 发 生 ) 
- -role=ROLENAME 在 恢复 之 前 执行 SET ROLE 命 令 












































OQ@Q@ PostgreSQL 10 中 引入 的 新 特性 

@@ PostgreSQL 9.6 中 引入 的 新 特性 。 在 9.6 版 之 前 ，-t 选项 只 用 
于 过 滤 普 通 表 。 在 9.6 版 中 ， 它 拓展 支持 了 外 表 、 视 图 、 物 化 视图 
和 序列 号 生成 器 。 


@ PostgreSQL 9.5 中 引入 的 新 特性 





01. B.4 交互 模式 下 的 psql 命 令 


示例 B-4 中 列 出 了 psql 在 交互 模式 下 文 持 的 命令 。 请 参考 3.1 节 和 
3.2 节 的 例子 了 解 其 使 用 方法 。 


示例 B-4 ”psql 交互 模式 下 支持 的 命令 


\? 
通用 命令 

\copyright 

\errverbose 

\g [文件 ] or ; 

\gexec 

\gset [PREFIX] 

\h [名 称 ] 

\gx [文件 ] 

\q 

\crosstabview [COLUMNS] 
\watch [SEC] 























帮助 
\? [commands ] 
\? options 
\? variables 


\h [名 称 ] 


查询 缓冲 区 相关 命令 
\e [FILE] [LINE] 
\ef [FUNCNAME [LINE]] 
\ev [VIEWNAME [LINE]] 























输入 /输出 相关 命令 
\copy ... 
\echo [字符 串 
\i 文件 

\ir FILE 








\o [文件 ] 
\qecho [字符 串 ] 





显示 PostgreSQL 使 用 和 分 发 条 款 

以 最 元 长 的 形式 显示 最 近 的 错误 消息 @ 

执行 查询 《〈 并 将 结果 发 送 给 文件 或 | 管道 ) 

执行 策略 ， 然 后 执行 其 结果 中 的 每 个 值 @ 

执行 查询 并 将 结果 存储 到 psq1 变 量 中 

关于 SQL 命令 语法 的 帮助 ，* 代 表 所 有 命令 

作用 与 \g 相 同 ， 但 强行 要 求 使 用 展开 模式 显示 结果 
退出 psq1l 

执行 查询 并 且 以 交叉 表 显 示 结 果 @ 

每 隔 SEC 秒 执行 一 次 查询 











































































































显示 反 斜 线 命令 的 帮助 
显示 psql 命令 行 选项 的 帮助 
AM 

















显示 特殊 变量 的 帮助 
SQL 命令 语法 上 的 说 明 ， 用 * 显 示 全 部 命令 的 语法 说 明 











使 用 外 部 编辑 嚣 编辑 查询 缓冲 区 (或 文件 ) 
使 用 外 部 编辑 器 编辑 函数 定义 

用 外 部 编辑 器 编辑 视图 定义 加 

显示 但 询 缓冲 区 的 内 容 

重 置 〈 清 除 ) 查询 缓冲 区 

将 查询 缓冲 区 写 入 到 文件 




























































































执行 SQL COPY， 将 数据 流 发 送 到 客户 端 主机 

将 字符 串 写 到 标准 输出 

从 文件 执行 命令 

与 \i 类 似 ， 但 是 在 脚本 中 执行 时 ， 认 为 目标 文件 的 位 
脚本 所 在 的 目录 

将 所 有 碍 询 结果 发 送 到 文件 或 | 管道 
将 字符 串 写 入 到 查询 输出 流 ， 该 命令 等 效 于 \echo， 
输出 将 写 入 由 \o 设 置 的 输出 通道 




































































条 件 命令 


© 


\if EXPR 
\elif EXPR 


\d[S+] 
\d[S+] 
\da[S] 
\dA[+] 
\db[+] 
\dc[S] 
\dC 
\dd[S] 
\ddp 
\dD[S] 
\det[+] 
\des[+] 
\deu[+] 
\dew[+] 


\df[antw][S+] [模式 ] 


\dF[+] 
\dFd[+] 
\dFp[+] 
\dFt[+] 
\dg[S+] 
\di[S+] 
\dl 
\dL[S+] 
\dm[S+] 
\dn[S+] 
\do[S] 
\do[S+] 
\dp 


\drds [模式 1 [模式 2]] 


\dRp[+] 
\dRs[+] 
\ds[S+] 
\dt[S+] 
\dT[S+] 
\du[S+] 
\dv[S+] 
\dE[S+] 
\dx[+] 





[模式 ] 


[模式 ] 
[模式 ] 
[模式 ] 
[模式 ] 
[模式 ] 
[模式 ] 


[模式 ] 
[模式 ] 
[模式 ] 
[模式 ] 
[模式 ] 
[模式 ] 





[PATTERN] 
[PATTERN] 
[模式 ] 
[模式 ] 
[模式 ] 
[模式 ] 
[模式 ] 
[模式 ] 
[模式 ] 








开启 一 个 条 件 判 定 块 
当前 条 件 判 定 块 中 的 分 支 条 件 判定 
当前 条 件 判 定 块 中 的 最 终 条 件 判定 
条 件 块 结束 符 




















显示 系统 对 象 ，+ = 附加 的 详细 信息 ) 


输出 表 、 视 图 和 序列 列表 
省 述 表 、 视 图 、 序 列 或 索引 
i 出 聚合 函数 列表 

访问 方法 @ 

H 表 空间 列表 
编码 转换 (conversion) 列表 
类 型 强制 转换 (cast) 列表 
示 对 象 上 的 注释 

出 默认 权限 列表 

域 列表 
外 部 表 列 表 
外 部 服务 器 列表 

用 户 映 射 列表 

外 部 数据 封装 器 列表 

特定 类 型 函数 〈 仅 a- 聚 合 函数 /n- 常 规范 数 /七 -外 
W- 窗 口 函 数 ) 列表 

文本 搜索 配置 列表 
文本 搜索 字典 列表 
文 
文 
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ww 


























本 搜索 解析 器 列表 
本 搜索 模版 列表 
角色 列表 
从 出 索引 列表 
丛 出 大 对 象 列 表 ， 与 \l0o_list 相 同 
时 过 程式 语言 列表 

物化 视图 列表 

Hschema 列 表 

运算 符 列表 
排序 规则 列表 

表 、 视 图 和 序列 访问 权限 列表 
i 出 每 个 database 的 角色 设置 列表 
1 出 逻辑 复制 的 数据 源 定义 合 

| 出 逻辑 复制 的 订阅 定义 操 
序列 列表 
上 表 列 表 
数据 类 型 列表 
角色 列表 
视图 列表 
外 部 表 列 表 
扩展 列表 
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\dy [模式 ] 输出 事件 触发 器 列表 
\1[+] 输出 数据 库 列 表 

\sf[+] FUNCNAME 显示 函数 定义 

\sv[+] VIEWNAME 显示 一 个 视图 的 定义 人 @ 
\z [模式 ] 和 \dp 的 功能 相同 


格式 化 相关 命令 

\a 在 非 对 齐 输出 模式 和 对 齐 输出 模式 之 间 切 换 

\C [字符 串 ] 设置 表 标 题 ， 或 者 如 果 没 有 ， 则 不 设置 

\f [字符 串 ] 显示 或 设置 非 对 齐 碍 询 输出 的 字段 分 隅 符 

\H 切换 HTML 输 出 模式 (当前 关闭 ) 

\pset NAME [VALUE] 设置 表 输 出 选项 
(NAME 的 可 选项 有 format、border、expanded、fi 
fieldsep zero、 footer、 null、 numericlocale 
recordsep、tuples only、 title、tableattr、 
pager min lines、recordsep、recordsep_ zero 
title、 tuples only、 unicode border linesty 
unicode _ column linestyle、 unicode header 1 

\t [on|off] 仅 显 示 行 (当前 关闭 ) 

\T [字符 串 ] 设置 HTML 

\x [on|off] 切换 扩展 输出 (当前 关闭 ) 












































连接 相关 命令 

\c[onnect] {[DBNAME|- USER|- HOST|- PORT|-] | conninfo} 
连接 到 新 数据 库 〈( 当 前 是 "postgres") 

\encoding [编码 名 称 ] 显示 或 设置 客户 端 编码 

\password [USERNAME ] 安全 地 为 用 户 更 改 密码 

\conninfo 显示 当前 连接 的 相关 信息 
























































操作 系统 相关 命令 

\cd [目录 ] 更 改 当 前 工作 目录 

\setenv NAME [VALUE] 设置 或 取消 设置 环境 变量 

\timing [on|off] 切换 命令 计时 开关 《当前 关闭 ) 

! [命令 ] 在 shell 中 执行 命令 或 启动 交互 式 shell 





























be PostgreSQL 10 中 引入 的 新 特性 。 所 有 的 条 件 参 数 都 是 新 引 
入 的 。 


@OGOOO® PostgreSQL 9.6 中 引入 的 新 特性 。 
人 @ PostgreSQL 9.5 中 引入 的 新 特性 。 


01. B.5 非 交 互 模式 下 的 psql 命 令 


示例 B-5 是 非 交 互 模式 下 psql 的 命令 行 帮助 信息 。 关 于 该 模式 下 的 


具体 使 用 例子 请 参考 3.2 节 。 
示例 B-5 ”psgql 基本 帮助 信息 


psql --help 


psql 是 PostgreSQL 的 交互 式 终端 。 
使 用 方法 : 
psql [选项 ] . . 





























。[database 名 称 [用 广 

















选项 : 
--Command= 命 令 
--dbname= 数 据 库 名 称 
--file= 文 件 名 
--list 
--Set=， 








--variable=NAME=VALUE 


-X,--no-psqlrc 

-1 ("one"), --single-transaction 

-?，--help[=options |] 
--help=commands 
--help=variables 

--version 


输入 和 输出 选项 : 
-a，--echo-al1 
-b, --echo-errors 
-e，--echo-queries 
-E，--echo-hidden 
-L，--log-file= 文 件 名 
-n，--no-readline 
--oOutput=FILENAME 
-q，--quiet 
-S，--Single-step 
-S, --single-line 





输出 格式 选项 : 
-A，--no-align 
-F，--field-separator= 字 符 
-H,--html 





串 设置 字段 

















仅 运 行 单个 命令 (SsQL 或 内 部 命令 ) ， 然 
要 连接 到 的 数据 库 名 称 

从 文件 执行 命令 ， 然 后 退出 

列 出 可 用 的 数据 库 ， 然 后 退出 





























设置 psq1 变 量 NAME 为 VALUE 
(例如 ，-v ON_ERROR_STOP=1) 
不 读 取 启动 文件 (~/ .psqlrc) 
将 命令 文件 作为 单一 事务 执行 
显示 此 帮助 ， 然 后 退出 
列 出 反例 线 命令 ， 然后 退 
列 出 特殊 变量 ， 然 后 退 
输出 版 本 信息 并 退出 


















































回 显 所 有 来 自 二 脚本 的 输入 
回 显 失败 的 命令 © 
回 显 发 送 给 服务 器 的 命令 
显示 内 部 命令 生成 的 查询 
志 发 送 给 文件 
兽 强 命令 行 编辑 功能 (readline) 
将 查询 结果 发 送 给 文件 (或 | 管道 ) 

以 静默 模式 运行 〈 不 显示 消息 ， 仅 显示 
单 步 模式 (每 个 查询 均 需 确认 ) 

单行 模式 〈SQL 命 令 不 允许 跨行 ) 


































































































非 对 齐 表 输出 模式 
分 隔 符 〈 默 认为 “|”) 
HTML 表 输出 模式 


-P，--pset=VAR[=ARG] 将 打印 选项 VAR 设 置 为 AR〈 人 参见 \pset 命 


























-R，--record-separator= 字 符 串 设置 记录 分 隔 符 (默认 为 换行 符 ) 

-t, --tuples-only 仅 打 印行 

-T，--table-attr= 文 本 设置 HTML 表 标记 属性 〈 例 如 : 宽度 、 边 机 
-X，--expanded 打开 扩展 表 输 出 

-z, --field-separator-zero 将 字段 分 隅 符 设置 为 零 字 节 
-86，--record-separator-zero 将 记录 分 隔 符 设置 为 零 字 节 











连接 选项 : 

-h，--host= 主 机 名 数据 库 服 务 器 主机 或 套 接 字 目录 
-p，--port= 端 口 数据 库 服 务 器 端口 (默认 为 “5432”) 
-U，--username= 用 户 名 数据 库 用 户 名 
-W，--no-password 永远 不 提示 输入 密码 

-W, --password 强制 要 求 输 入 密码 〈 应 该 自动 发 生 ) 














































































































如 需 了 解 更 多 信息 ， 请 在 psql 中 输入 “\?”( 用 于 内 部 命令 ) 或 者 *\help”( 用 





OQ@Q@ PostgreSQL 9.5 中 引入 的 新 特性 。 
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公司 Paragon Corporation 的 负责 人 之 一 。 她 具有 20 余年 的 数据 库 
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pgRouting: A Practical Guide 这 两 本 书 的 作者 之 一 。 























01. 


封面 介绍 


本 书 封 面 上 的 动物 是 象 购 〈 拉 ] 名 为 Macroscelides 
Proboscideus) ， 这 是 一 种 原 产 于 非洲 的 食 虫 性 哺乳 动物 ， 广 泛 分 
布 于 非洲 南部 ， 因 有 着 类 似 大 象 的 长 曙 而 得 名 。 它 们 能 够 适应 各 种 
各 样 的 生存 环境 : 无 论 是 纳米 布 沙漠 ， 还 是 砾石 履 盖 的 南部 非洲 地 
区 ， 甚 至 成 密 的 森林 地 带 ， 都 是 它们 的 栖 居 之 地 。 


象 唤 是 一 种 体型 很 小 的 四 足 动物 。 由 于 尾巴 非常 相似 ， 象 购 外 表 上 
看 起 来 像 是 老鼠 或 者 负 鼠 。 相 较 于 其 体型 来 次 ， 筷 们 的 腿 可 以 说 相 
当 之 长 ， 因 此 它们 可 以 跳跃 行走 ， 看 起 来 和 兔子 很 相似 。 它 们 的 曼 
子 根据 亚 种 的 不 同 而 长 度 各 异 ， 但 在 寻找 食物 时 都 可 以 左右 扭 动 。 


虽然 象山 是 一 种 活跃 的 昼 行 性 动物 ， 但 由 于 其 个 性 机 警 ， 所 以 一 般 
很 难 见 到 或 者 捕捉 到 它们 。 它 们 很 善于 伪装 ， 在 遇 到 危险 时 会 迅速 
逃避 。 


象 哆 并 非 高 度 群 大 性 的 动物 ， 很 多 个 体 痢 是 以 一 夫 一 妻 的 方式 结伴 
生活 并 共同 保护 它们 的 领地 。 上 峻 性 象 哆 有 着 类 似 人 类 女性 的 月 经 周 
期 ， 其 发 情 期 会 持续 好 几 天 。 雌 性 个 体 怀 孕 以 后 ， 其 妊娠 期 会 持续 
45 至 60 天 ， 一 年 会 生育 奉 干 胎 ， 每 胎 约 有 1 到 3 只 幼 购 。 幼 鸯 出 
生 时 其 身体 已 经 发 育 得 比较 完全 ， 几 天 后 就 会 离开 巢穴 。 


出 生 5 天 之 后 ， 幼 网 开始 进食 昆虫 ， 这 些 昆虫 由 它们 的 母亲 捕获 并 
衔 在 口中 携带 回来 。 幼 网 会 在 出 生 之 后 大 约 15 天 开始 尝试 独立 生 
活 并 逐步 减少 对 母 杀 的 依赖 。 随 后 它们 会 圈定 自己 的 领地 ， 并 在 

41 至 46 天 内 达到 性 成 熟 状 态 。 


成 年 象 哆 主要 以 无 硝 椎 动物 为 食 ， 比 如 昆虫 、 蜂 蛛 、 蚂 肉 、 干 足 虫 
以 及 旺 晤 等。 要 想 吃 挥 个 头 更 大 些 的 猎物 对 它们 来 说 会 有 点 困难 ， 
它们 必须 用 脚 拖 住 猎物 ， 再 用 牙齿 把 食物 撕 扯 成 雄 片 ， 等 这 些 碎片 
落 到 地 上 之 后 ， 象 鸯 会 像 食 收 组 那样 用 百 头 将 它们 栈 进 嘴 里 。 象 其 
同时 也 是 植 食性 动物 ， 如 果 能 找到 的 话 ， 嫩 时 、 种 子 、 小 型 果实 等 
也 都 是 它们 的 美食 。 









































很 多 出 现在 O'Reilly 图 书 封面 上 的 动物 都 濒临 灭绝 ， 它 们 的 存在 对 
于 维持 地 球 的 物种 多 样 性 非常 重要 ， 如 有 果 你 希望 为 保护 它们 尽 一 份 
力量 ， 请 访问 animals.oreilly.com 以 了 解 详 情 。 


封面 图 片 来 自 于 Meyers Kleines 词典 。 


01. 看 完了 


如 果 您 对 本 书 内 容 有 疑问 ， 可 发 邮件 至 contact@turingbook.com， 会 
有 编辑 或 作 译 者 协助 答疑 。 也 可 访问 图 灵 社 区 ， 参 与 本 书 讨论 。 


如 果 是 有 关 电 子 书 的 建议 或 问题 ， 请 联系 专用 客服 邮箱 : 


ebookturingbook.com。 
在 这 里 可 以 找到 我 们 : 
微 博 @ 图 灵 教 育 : 好 书 、 活 动 每 日 播报 


。 微 博 @ 图 灵 社 区 : 电子 书 和 好 文章 的 消 忆 
。 微 博 @ 图 灵 新 知 : 图 灵 教 育 的 科普 小 组 








微 信 图 灵 访 谈 : ituring_interview， 讲 述 码 农 精彩 人 和 牛 
微 信 图 灵 教 育 : turingbooks 
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